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Description 


[0001] Laprésente invention est relative a une nouvelle souche de coronavirus associé au syndrome respiratoire aigu 
sévére (SRAS), issue d’un prélévement répertorié sous le n° 031589 et prélevé a Hanoi (Vietnam), a des molécules 
d’acide nucléique issues de son génome, aux protéines et peptides codés par lesdites molécules d’acide nucléique ainsi 
qu’a leurs applications, notamment en tant que réactifs de diagnostic et/ou comme vaccin. 

[0002] Le coronavirus est un virus a ARN monocaténaire, de polarité positive, d’approximativement 30 kilobases qui 
se réplique dans le cytoplasme des cellules hétes ; l’extrémité 5’ du génome a une structure en coiffe et l’extrémité 3’ 
comporte une queue polyA. Ce virus est enveloppé et comprend, a sa surface, des structures péplomériques dénommées 
spicules. 

[0003] Le génome comprend les cadres ouverts de lecture ou ORF suivants, de son extrémité 5’ vers son extrémité 
3’: ORF1a et ORF 1b correspondant aux protéines du complexe de transcription-réplication, et ORF-S, ORF-E, ORF- 
M et ORF-N correspondant aux protéines structurales S, E, M et N. Il comprend également des ORFs correspondant 
a des protéines de fonction inconnue codées par: la région située entre l'ORF-S et l'ORF-E et chevauchant cette 
derniére, la région située entre lORF-M et l’ORF-N, et la région incluse dans |'ORF-N. 

[0004] Laprotéine S est une glycoprotéine membranaire (200-220 kDa) qui se présente sous la forme de spicules ou 
"Spike" émergeant de la surface de l’enveloppe virale. Elle est responsable de |l’attachement du virus aux récepteurs 
de la cellule hdte et de l’induction de la fusion de l’enveloppe virale avec la membrane cellulaire. 

[0005] La petite protéine d’enveloppe (E) également dénommeée sM (small membrane) qui est une protéine trans- 
membranaire non glycosylée d’environ 10 kDa, est la protéine présente en plus faible quantité dans le virion. Elle joue 
un role moteur dans le processus de bourgeonnement des coronavirus qui se produit au niveau du compartiment 
intermédiaire dans le réticulum endoplasmique et l'appareil de Golgi 

[0006] La protéine M ou protéine de matrice (25-30 kDa) est une glycoprotéine membranaire plus abondante qui est 
intégrée dans la particule virale par une interaction M/E, tandis que l’incorporation de S dans les particules est dirigée 
par une interaction S/M. Elle semble étre importante pour la maturation virale des coronavirus et pour la détermination 
du site au niveau duquel les particules virales sont assemblées. 

[0007] La protéine N ou protéine de nucléocapside (45-50 kDa) qui est la plus conservée parmi les protéines struc- 
turales des coronavirus, est nécessaire pour encapsider l'ARN génomique puis pour diriger son incorporation dans le 
virion. Cette protéine est vraisemblablement également impliquée dans la réplication de l'ARN. 

[0008] Lorsqu’une cellule héte est infectée, le cadre de lecture (ORF) situé en 5’ du génome viral est traduit en une 
polyprotéine qui est clivée par les protéases virales et libére alors plusieurs protéines non-structurales telles que lARN- 
polymérase ARN dépendante (Rep) et l'ATPase hélicase (Hel). Ces deux protéines sont impliquées dans la réplication 
du génome viral ainsi que dans la génération de transcrits qui sont utilisés dans la synthése des protéines virales. Les 
mécanismes par lesquels ces ARNms sub-génomiques sont produits, ne sont pas complétement compris ; cependant 
des faits récents indiquent que les sequences de régulation de la transcription a l’extrémité 5’ de chaque géne représentent 
des signaux qui régulent la transcription discontinue des ARNms sub-génomiques. 

[0009] Les protéines de la membrane virale (protéines S, E et M) sont insérées dans le compartiment intermédiaire, 
alors que l'ARN répliqué (brin +) s’assemble avec la protéine N (nucléocapside). Ce complexe protéine-ARN s’associe 
ensuite avec la protéine M incluse dans les membranes du réticulum endoplasmique et les particules virales se forment 
lorsque le complexe de la nucléocapside bourgeonne dans le réticulum endoplasmique. Le virus migre ensuite a travers 
le complexe du Golgi et éventuellement sort de la cellule, par exemple par exocytose. Le site de l’attachement du virus 
a la cellule héte se trouve au niveau de la protéine S. 

[0010] Les coronavirus sont responsables de 15 a 30 % des rhumes chez I’'Homme et d’infections respiratoires ou 
digestives chez les animaux, notamment le chat (FIPV : Feline infectious peritonitis virus), la volaille (IBV : Avian Infec- 
tious bronchitis virus), la souris (MHV : Mouse Hepatitis virus), le porc (TGEV : Transmissible gastroenterititis virus, 
PEDV : Porcine Epidemic Diarrhea virus, PRCoV : Porcine Respiratory Coronavirus, HEV : Hemagglutinating ence- 
phalomyelitis Virus) et les bovins (BcoV : Bovine coronavirus). 

[0011] En général, chaque coronavirus n’affecte qu’une seule espéce ; chez les individus immunocompétents, |’in- 
fection induit des anticorps éventuellement neutralisants et une immunité cellulaire, capables de détruire les cellules 
infectées. 

[0012] Une épidémie de pneumonie atypique, dénommée syndrome respiratoire aigu sévére (SARS ou Severe acute 
respiratory syndrome, SRAS en frangais) s’est propagée dans différents pays (Vietnam, Hong-Kong, Singapour, Thailan- 
de et Canada) au cours du premier trimestre 2003, a partir d’un foyer initial apparu en Chine dans le dernier trimestre 
de 2002. La sévérité de cette maladie est telle que son taux de mortalité est d’environ 3 a 6 %. La détermination de 
l'agent causatif de cette maladie a été entreprise par de nombreux laboratoires, a travers le monde. 

[0013] En mars 2003, un nouveau coronavirus (SARS-CoV, SARS virus ou virus SRAS, en frangais) a été isolé, en 
association avec des cas de syndrome respiratoire aigu sévére (T.G.KSIAZEK et al., The New England Journal of 
Medicine, 2003, 348, 1319-1330 ; C. DROSTEN et al., The New England Journal of Medicine, 2003, 348, 1967-1976 ; 


10 


15 


20 


25 


30 


35 


40 


45 


50 


55 


EP 1 694 829 B1 


Peiris et al., Lancet, 2003, 361, 1319-). 

[0014] Des séquences génomiques de ce nouveau coronavirus ont ainsi été obtenues, notamment celles de l’isolat 
Urbani (Genbank n° d’accés AY274119.3 et A. MARRA et al., Science, May 1, 2003, 300, 1399-1404) et de l’isolat de 
Toronto (Tor2, Genbank n° d’accés AY 278741 et A. ROTA et al., Science, 2003, 300, 1394-1399). 

[0015] L’organisation du génome est comparable a celle des autres coronavirus connus permettant ainsi de confirmer 
l'appartenance du SARS-CoV a la famille des Coronaviridae ; les cadres ouverts de lecture ORF 1a et 1b et les cadres 
ouverts de lecture correspondant aux protéines S, E, M, et N, ainsi qu’a des protéines codées par : la région située entre 
lORF-S et ORF-E (ORF3), la région située entre l'ORF-S et l'ORF-E et chevauchant l'ORF-E (ORF4), la région située 
entre lORF-M et l’ORF-N (ORF7 a ORF11) et la région correspondant a | ORF-N (ORF13 et ORF 14), ont notamment 
été identifiées. 

[0016] Sept différences ont été mises en évidence entre les séquences des isolats Tor2 et Urbani ; 3 correspondent 
a des mutations silencieuses (c/t en position 16622 et a/g en position 19064 de l'ORF 1b, t/c en position 24872 de l'ORF- 
S) et 4 modifient la sequence en acides aminés de respectivement : les protéines codées par l'ORF 1a (c/t en position 
7919 correspondant a la mutation A/V), la protéine S (g/t en position 23220 correspondant a la mutation A/S), la protéine 
codée par l’'ORF3 (a/g en position 25298 correspondant a la mutation R/G) et de la protéine M (t/c en position 26857 
correspondant a la mutation S/P). 

[0017] En outre, l’analyse phylogénétique montre que le SARS-CoV est éloigné des autres coronavirus et qu’il est 
apparu, ni par mutation de coronavirus respiratoires humains, ni par recombinaison entre des coronavirus connus (pour 
une revue, voir Holmes, J.C.I., 2003, 111, 1605-1609). 

[0018] La mise en évidence et la prise en compte de nouveaux variants sont importantes pour la mise au point de 
réactifs de détection et de diagnostic du SRAS suffisamment sensibles et spécifiques ainsi qu’a des compositions 
immunogénes aptes a protéger des populations contre des épidémies de SRAS. 

[0019] Les Inventeurs ont maintenant mis en évidence une autre souche de coronavirus associé au SRAS, qui se 
distingue des isolats Tor2 et Urbani. 

[0020] La présente invention a donc pour objet, une souche isolée ou purifiée de coronavirus humain associé au 
syndrome respiratoire aigu sévére, caractérisée en ce que son génome présente sous la forme d’ADN complémentaire 
un codon sérine en position 23220-23222 du géne de la protéine S ou un codon glycine en position 25298-25300 du 
géne de l’ORF3, et un codon alanine en position 7918-7920 de l(ORF1a ou un codon sérine en position 26857-26859 
du géne de la protéine M, lesdites positions étant indiquées en référence a la sequence Genbank AY274119.3. 
[0021] Selon un mode de réalisation avantageux de ladite souche, l’équivalent ADN de son génome présente une 
séquence correspondant a la sequence SEQ ID NO: 1 ; cette souche de coronavirus est issue du prélevement de 
lavage bronchoalvéolaire d’un patient atteint de SRAS, répertorié sous le n° 031589 et effectué a I’hépital francais de 
Hanoi (Vietnam). 

[0022] Conformément a l’invention, ladite sequence SEQ ID NO :1 est celle de l’acide désoxyribonucléique corres- 
pondant a la molécule d’acide ribonucléique du génome de la souche isolée de coronavirus telle que définie ci-dessus. 
[0023] La séquence SEQ ID NO: 1 se distingue de la séquence Genbank AY274119.3 (isolat Tor2) en ce qu’elle 
posséde les mutations suivantes : 


- g/t en position 23220 ; le codon alanine (gct) en position 577 de la sequence en acides aminés de la protéine S de 
Tor2 est remplacé par un codon sérine (tct), 

- a/gen position 25298 ; le codon arginine (aga) en position 11 de la séquence en acide aminés de la protéine codée 
par l’ORF3 de Tor 2 est remplacé par un codon glycine (gga). 


[0024] En outre, la séquence SEQ ID NO: 1 se distingue de la sequence Genbank AY278741 (isolat Urbani) en ce 
qu’elle posséde les mutations suivantes : 


- t/c en position 7919 ; le codon valine (gtt) en position 2552 de la séquence en acides aminés de la protéine codée 
par ORF 1a est remplacé par un codon alanine (gct), 

- t/c en position 16622 : cette mutation ne modifie pas la séquence en acides aminés des protéines codées par 
ORF 1b (mutation silencieuse), 

- g/aen position 19064 : cette mutation ne modifie pas la séquence en acides aminés des protéines codées par 
l'ORF1b (mutation silencieuse), 

- cit en position 24872 : cette mutation ne modifie pas la sequence en acides aminés de la protéine S, et 

- cit en position 26857 : le codon proline (ccc) en position 154 de la sequence en acides aminés de la protéine M est 
remplacé par un codon sérine (tcc). 


[0025] Enl’absence de mention particuliére, les positions des sequences nucléotidiques et peptidiques sont indiquées 
en référence a la sequence Genbank AY274119.3. 
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[0026] La présente invention a également pour objet un polynucléotide isolé ou purifié, caractérisé en ce que sa 
séquence est celle du génome de la souche isolée de coronavirus telle que définie ci-dessus. 

[0027] Selon un mode de réalisation avantageux dudit polynucléotide il présente la sequence SEQ ID NO: 1. 
[0028] Les Inventeurs décrivent également un polynucléotide isolé ou purifié, caractérisé en ce que sa séquence 
hybride dans des conditions de forte stringence avec la séquence du polynucléotide tel que défini ci-dessus. 

[0029] Les termes « isolé ou purifié » signifient modifié « parla main de l'homme » a partir de |’état naturel ; autrement 
dit si un objet existe dans la nature, il est dit isolé ou purifié s’il a été modifié ou extrait de son environnement naturel 
ou les deux. Par exemple, un polynucléotide ou une protéine/un peptide naturellement présent dans un organisme vivant 
nest ni isolé, ni purifié ; en revanche le méme polynucléotide ou protéine /peptide séparé des molécules coexistantes 
dans son environnement naturel, obtenu par clonage, amplification et/ou synthése chimique est isolé au sens de la 
présente invention. De plus, un polynucléotide ou une protéine/peptide qui est introduit dans un organisme par trans- 
formation, manipulation génétique ou par toute autre méthode, est « isolé » méme s'il est présent dans ledit organisme. 
Le terme purifié tel qu’utilisé dans la présente invention, signifie que les protéines /peptides selon linvention sont 
essentiellement libres d’association avec les autres protéines ou polypeptides, comme |’est par exemple le produit purifié 
de la culture de cellules hétes recombinantes ou le produit purifié a partir d’une source non-recombinante. 

[0030] Onentend par conditions d’hybridation de forte stringence, des conditions de température et de force ionique 
choisies de telle maniére qu’elles permettent le maintien de I’hybridation spécifique et sélective entre polynucléotides 
complémentaires. 

[0031] A titre d’illustration, des conditions de forte stringence aux fins de définir les polynucléotides ci-dessus, sont 
avantageusement les suivantes : I’hybridation ADN-ADN ou ADN-ARN est réalisée en deux étapes : (1) préhybridation 
a 42°C pendant 3 heures en tampon phosphate (20 mM pH 7,5) contenant 5 x SSC (1 x SSC correspond a une solution 
0,15 M NaCl + 0, 015 M citrate de sodium), 50 % de formamide, 7 % de sodium dodécyl sulfate (SDS), 10 x Denhardt’s, 
5 % de dextran sulfate et 1 % d’ADN de sperme de saumon ; (2) hybridation pendant 20 heures a 42°C suivie de 2 
lavages de 20 minutes a 20°C en 2 x SSC + 2 % SDS, 1 lavage de 20 minutes a 20°C en 0,1 x SSC + 0,1 % SDS. Le 
dernier lavage est pratiqué en 0,1 x SSC + 0,1 % SDS pendant 30 minutes a 60°C. 

[0032] Les Inventeurs décrivent également un fragment représentatif du polynucléotide tel que défini ci-dessus, ca- 
ractérisé en ce qu’il est susceptible d’étre obtenu, soit par l'utilisation d’enzymes de restriction dont les sites de recon- 
naissance et de coupure sont présents dans ledit polynucléotide tel que défini ci-dessus, soit par amplification a l’aide 
d’amorces oligonucléotidiques spécifiques dudit polynucléotide tel que défini ci-dessus, soit par transcription in vitro, 
soit par synthése chimique. 

[0033] Selon un mode de réalisation avantageux dudit fragment, il est sélectionné dans le groupe constitué par : 
l’ADNc correspondant a au moins un cadre ouvert de lecture (ORF) choisi parmi : ORF1a, ORF1b, ORF-S, ORF-E, 
ORF-M, ORF-N, ORF3, ORF4, ORF7 a ORF11, ORF 13 et ORF 14, et ’ADNc correspondant aux extrémités 5’ ou 3’ 
non-codantes dudit polynucléotide. 

[0034] Selon une disposition avantageuse de ce mode de réalisation, ledit fragment présente une séquence sélec- 
tionnée dans le groupe constitué par : 


- les séquences SEQ ID NO: 2 et 4 représentant I ADNc correspondant a l'ORF-S qui code pour la protéine S, 

- les séquences SEQ ID NO: 13 et 15 représentant l'ADNc correspondant a l'ORF-E qui code pour la protéine E, 

- les séquences séquence SEQ ID NO: 16 et 18 représentant l ADNc correspondant a l'ORF-M qui code pour la 
protéine M, 

- les séquences SEQ ID NO: 36 et 38 représentant l’ADNc correspondant a lORF-N qui code pour la protéine N, 

- les séquences représentant les ADNc correspondant respectivement : aux ORF1a et ORF1b (ORFiab, SEQ ID 
NO : 31), aux ORF3 et ORF4 (SEQ ID NO: 7, 8), aux ORF 7 a 11 (SEQ ID NO: 19, 20), al(ORF13 (SEQ ID NO: 
32) et alORF 14 (SEQ ID NO: 34), et 

- les séquences représentant les ADNc correspondant respectivement aux extrémités 5’(SEQ ID NO : 39 et 72) et 
3’ non-codantes (SEQ ID NO : 40, 73) dudit polynucléotide. 


[0035] Les Inventeurs décrivent également un fragment de l'ADNc codant pour la protéine S, tel que défini ci-dessus, 
caractérisé en ce qu’il presente une séquence sélectionnée dans le groupe constitué par les séquences SEQ ID NO: 
5 et 6 (fragments Sa et Sb). 

[0036] Les Inventeurs décrivent également un fragment de l ADNc correspondant aux ORF 1a et ORF 1b tel que défini 
ci-dessus, caractérisé en ce qu’il présente une séquence sélectionnée dans le groupe constitué par les sequences SEQ 
ID NO: 41 a 54 (fragments LO a L12). 

[0037] Les Inventeurs décrivent également un fragment du polynucléotide tel que défini ci dessus, caractérisé en ce 
qu’il présente au moins 15 bases ou paires de bases consécutives de la sequence du génome de ladite souche incluant 
au moins une de celles situées en position 7979, 16622, 19064, 23220, 24872, 25298 et 26857. De préférence, il s’agit 
d’un fragment de 20 a 2500 bases ou paires de bases, de maniére préférée de 20 a 400. 
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[0038] Laprésente invention a également pour objet un fragment du plynucléotide tel que défini ci-dessus, caractérisé 
en ce qu’il comprend les ou est constitué des bases ou de paires de bases consécutives des positions 7919 a 23220, 
7919 a 25298, 16622 a 23220, 19064 a 23220, 16622 a 25298, 19064 a 25298, 23220 a 24872, 23220 a 26857, 24872 
a 25298, ou 25298 a 26857. 

[0039] Les Inventeurs décrivent également des amorces d’au moins 18 bases aptes a amplifier un fragment du genome 
d’un coronavirus associé au SRAS ou de |’équivalent ADN de celui-ci. 

[0040] Selon un mode de réalisation desdites amorces, elles sont sélectionnées dans le groupe constitué par : 


- la paire d’amorces n° 1 correspondant respectivement aux positions 28507 a 28522 (amorce sens, SEQ ID NO: 
60) et 28774 a 28759 (amorce anti-sens, SEQ ID NO : 61) de la séquence du polynucléotide tel que défini ci-dessus, 

- la paire d’amorces n° 2 correspondant respectivement aux positions 28375 a 28390 (amorce sens, SEQ ID NO: 
62) et 28702 a 28687 (amorce anti-sens, SEQ ID NO : 63) de la sequence du polynucléotide tel que défini ci-dessus., 
et 

- la paire d’amorces constituée des amorces SEQ ID Nos 55 et 56. 


[0041] Les Inventeurs décrivent également une sonde apte a détecter la presence du génome d’un coronavirus associé 
au SRAS ou d’un fragment de celui-ci, caractérisée en ce qu’elle est sélectionnée dans le groupe constitué par : les 
fragments tels que définis ci-dessus et les fragments correspondant aux positions suivantes de la séquence du polynu- 
cléotide tel que défini ci-dessus : 28561 a 28586, 28588 a 28608, 28541 a 28563 et 28565 a 28589 (SEQ ID NO :64a67). 
[0042] Les sondes et amorces telles que définies ci-dessus peuvent étre marquées directement ou indirectement par 
un composé radioactif ou non radioactif par des méthodes bien connues de I'Homme du Métier, afin d’obtenir un signal 
détectable et/ou quantifiable. Parmi les isotopes radioactifs utilisés, on peut citer le22P, le 33P, le 35S, le 3H ou 1’125]. 
Les entités non radioactives sont sélectionnées parmi les ligands tels que la biotine, l’avidine, la streptavidine, la digoxy- 
génine, les hapténes, les colorants, les agents luminescents tels que les agents radioluminescents, chemoluminescents, 
bioluminescents, fluorescents, phosphorescents. 

[0043] Les Inventeurs décrivent des sondes et des amorces marquées dérivées des séquences précédentes. 
[0044] De telles sondes et amorces sont utiles pour le diagnostic de l’infection par un coronavirus associé au SRAS. 
[0045] Les Inventeurs décrivent également une méthode de détection d’un coronavirus associé au SRAS, a partir 
d’un échantillon biologique, laquelle méthode est caractérisée en ce qu’elle comprend au moins : 


(a) extraction d’acides nucléiques présents dans ledit échantillon biologique, 
(b) amplification d’un fragment de lORF-N par RT-PCR al’aide d’une paire d’amorces telle que définie ci-dessus, et 
(c) la détection par tout moyen approprié des produits d’amplifications obtenus en (b). 


[0046] Les produits d’amplifications (amplicons) en (b) sont de 268 pb pour la paire d’amorces n° 1 et de 328 pb pour 
la paire d’amorces n°2. 

[0047] Selon un mode de mise en oeuvre avantageux dudit procédé, |’étape (c) de détection est réalisée a l'aide d’au 
moins une sonde correspondant aux positions 28561 a 28586, 28588 a 28608, 28541 a 28563 et 28565 a 28589 de la 
séquence du polynucléotide tel que défini ci-dessus. 

[0048] De préférence, le génome du coronavirus associé au SRAS est détecté et éventuellement quantifié par PCR 
en temps réel, a l’aide de la paire d’amorces n°2 et des sondes correspondant aux positions 28541 a 28563 et 28565 
a 28589 marquées avec des composés différents, notamment des agents fluorescents différents. 

[0049] LaRT-PCR en temps réel qui met en oeuvre cette paire d’amorces et cette sonde est trés sensible puisqu’elle 
permet de détecter 102 copies d’ARN et jusqu’a 10 copies d’ARN, elle est en outre fiable et reproductible. 

[0050] Les Inventeurs décrivent des polydésoxyribonucléotides et des poly-ribonucléotides simple-brin, double-brin 
et tripe-brin correspondant a la sequence du génome de la souche isolée de coronavirus et de ses fragments tels que 
définis ci-dessus, ainsi qu’a leurs sequences complémentaires, sens ou anti-sens, notamment les ARN et les ADNc 
correspondant a la séquence du génome et de ses fragments tels que définis ci-dessus. 

[0051] Les Inventeurs décrivent également des fragments d’amplification obtenus a l’aide d’amorces spécifiques du 
génome de la souche purifiée ou isolée tel que défini ci-dessus, notamment a l’aide d’amorces et de paires d’amorces 
telles que définies ci-dessus, des fragments de restriction constitués par ou comprenant la séquence des fragments 
tels que définis ci-dessus, des fragments obtenus par transcription in vitro a partir d’un vecteur contenant la séquence 
SEQ ID NO: 1 ou un fragment tel que défini ci-dessus, ainsi que des fragments obtenus par synthése chimique. Des 
exemples de fragments de restriction sont déduits de la carte de restriction de la sequence SEQ ID NO : 1 illustrée par 
la figure 13. Lesdits fragments sont, soit sous forme de fragments isolés, soit sous forme de mélanges de fragments. 
Les Inventeurs décrivent également des fragments modifiés, par rapport aux précédents, par enlévement, ou addition 
de nucléotides dans une proportion d’environ 15 %, par rapport a la longueur des fragments ci-dessus et/ou modifiés 
au niveau de la nature des nucléotides, dés lors que les fragments nucléotidiques modifiés conservent une capacité 
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d’hybridation avec les sequences d’ARN génomiques ou antigénomiques de l’isolat tel que défini ci-dessus. 

[0052] Les molécules d’acide nucléique telles que définies ci-dessus sont obtenues par les méthodes classiques, 
connues en elles-mémes, en suivant les protocoles standards tels que ceux décrits dans Current Protocols in Molecular 
Biology (Frederick M. AUSUBEL,2000, Wiley and son Inc, Library of Congress, USA). Par exemple, elles peuvent étre 
obtenues par amplification d’une séquence nucléique par PCR ou RT-PCR ou bien par synthése chimique totale ou 
partielle. 

[0053] Les Inventeurs décrivent également une puce ou filtre a ADN ou a ARN, caractérisé en ce qu’il comprend au 
moins un polynucléotide ou l'un de ses fragments tels que définis ci-dessus. 

[0054] Les puces ou filtres 4 ADN ou a ARN tels que définis ci-dessus sont préparés par les méthodes classiques, 
connues en elles-mémes, comme par exemple greffage chimique ou électrochimique d’oligonucléotides sur support de 
verre ou de nylon. 

[0055] Les Inventeurs décrivent également un vecteur de clonage et/ou d’expression recombinant, notamment un 
plasmide, un virus, un vecteur viral ou un phage comprenant un fragment d’acide nucléique tel que défini ci-dessus. De 
préférence, ledit vecteur recombinant est un vecteur d’expression dans lequel ledit fragment d’acide nucléique est placé 
sous le contrdle d’éléments régulateurs de la transcription et de la traduction appropriés. En outre, ledit vecteur peut 
comprendre des séquences (étiquettes ou tag) fusionnées en phase avec l’extrémité 5’ et/ou 3’ dudit insert, utiles pour 
limmobilisation, et/ou la détection et/ou la purification de la protéine exprimée a partir dudit vecteur. 

[0056] Ces vecteurs sont construits et introduits dans des cellules hétes par les méthodes classiques d’ADN recom- 
binant et de génie génétique, qui sont connues en elles-mémes. De nombreux vecteurs dans lesquels on peut insérer 
une molécule d’acide nucléique d’intérét afin de l’introduire et de la maintenir dans une cellule héte, sont connus en 
eux-mémes ; le choix d’un vecteur approprié dépend de l'utilisation envisagée pour ce vecteur (par exemple réplication 
de la séquence d’intérét, expression de cette séquence, maintien de la sequence sous forme extrachromosomique ou 
bien intégration dans le matériel chromosomique de I’héte), ainsi que de la nature de la cellule hdte. 

[0057] Ledit plasmide est notamment sélectionné parmi les plasmides suivants : 


- le plasmide, dénommé SARS-S, compris dans la souche bactérienne déposée sous le n° I-3059, le 20 juin 2003, 
auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient la sequence d’ADNc codant pour la protéine S de la souche de SARS-CoV issue du prélevement 
répertorié sous le n° 031589, laquelle sequence correspondant aux nucléotides des positions 21406 a 25348 (SEQ 
ID NO: 4), en référence a la sequence Genbank AY274119.3, 

- le plasmide, deénommé SARS-S1, compris dans la souche bactérienne déposée sous le n° I-3020, le 12 mai 2003, 
auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient un fragment 5’ de la séquence d’ADNc codant pour la protéine S de la souche de SARS-CoV issue 
du prélévement répertorié sous le n° 031589, telle que définie ci-dessus, lequel fragment correspondant aux nu- 
cléotides des positions 21406 a 23454 (SEQ ID NO :5), en référence a la séquence Genbank AY274119.3 Tor2, 

- le plasmide, dénhommé SARS-S2, compris dans la souche bactérienne déposée sous le n° I-3019, le 12 mai 2003, 
auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient un fragment 3’de la sequence d’ADNc codant pour la protéine S de la souche de SARS-CoV issue 
du prélévement répertorié sous le n° 031589, telle que définie ci-dessus, lequel fragment correspondant aux nu- 
cléotides des positions 23322 a 25348 (SEQ ID NO :6), enréférence ala sequence Genbank n° d’accés AY274119.3, 

- le plasmide, dénommé SARS-SE, compris dans la souche bactérienne déposée sous le n° I-3126, le, 13 novembre 
2003, auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15; il contient lADNc correspondant a la région située entre ORF-S et l'ORF-E et chevauchant l'ORF-E de 
la souche de SARS-CoV issue du prélévement répertorié sous le n° 0315839, telle que définie ci-dessus, laquelle 
région correspondant aux nucléotides des positions 25110 a 26244 (SEQ ID NO :8), en référence a la séquence 
Genbank n° d’accés AY274119.3, 

- le plasmide, dénommé SARS-E, compris dans la souche bactérienne déposée sous le n° I-3046, le 28 mai 2003, 
auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient la séquence d’ADNc codant pour la protéine E de la souche de SARS-CoV issue du prélévement 
répertorié sous le n° 031589, telle que définie ci-dessus, laquelle sequence correspondant aux nucléotides des 
positions 26082 a 26413 (SEQ ID NO :15), en référence a la séquence Genbank n° d’accés AY274119.3, 

- le plasmide, dénommé SARS-M ; compris dans la souche bactérienne déposée sous le n° I-3047, le 28 mai 2003, 
auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient la séquence d’ADNc codant pour la protéine M de la souche de SARS-CoV issue du prélévement 
répertorié sous le n° 031589, telle que définie ci-dessus ; laquelle sequence correspondant aux nucléotides des 
positions 26330 a 27098 (SEQ ID NO :18), en référence a la séquence Genbank n° d’accés AY274119.3, 

- le plasmide dénommé SARS-MN, compris dans la souche bactérienne déposée sous le n° |-3125, le 13 novembre 
2003, auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
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Cedex 15 ; il contient la sequence d’ADNc correspondant a la région située entre lORF-M et lORF-N de la souche 
de SARS-CoV issue du prélévement répertorié sous le n° 031589 et prélevée a Hanoi, telle que définie ci-dessus, 
laquelle séquence correspondant aux nucléotides des positions 26977 a 28218 (SEQ ID NO :20), en référence a 
la sequence Genbank n° d’accés AY274119.3, 

- le plasmide dénommé SARS-N, compris dans la souche bactérienne déposée sous le n° |-3048, le 5 juin 2003, 
auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 
15 ; il contient l ADNc codant pour la protéine N de la souche de SARS-CoV issue du prélévement répertorié sous 
le n° 031589, telle que définie ci-dessus, laquelle sequence correspondant aux nucléotides des positions 28054 a 
29430 (SEQ ID NO :38), en référence a la séquence Genbank n° d’accés AY274119.3 ; ainsi ce plasmide comprend 
un insert de sequence SEQ ID NO :38 et est compris dans une souche bactérienne qui et qu’il a été déposée sous 
le n° 1-3048, le 5 juin 2003, auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur 
Roux, 75724 Paris Cedex 15, 

- le plasmide dénommé SARS-5’NC, compris dans la souche bactérienne déposée sous le n° |- 3124, le 7 novembre 
2003, auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15 ; il contient lADNc correspondant a l’extrémité 5’non codante du génome de la souche de SARS-CoV 
issue du prélévement répertorié sous le n° 0315839, telle que définie ci-dessus, laquelle sequence correspondant 
aux nucléotides des positions 1 a 204 (SEQ ID NO :39), enréférence ala sequence Genbank n° d’accés AY274119.3, 

- le plasmide dénommé SARS-3’NC, compris dans la souche bactérienne déposée sous le n° |-3123 le 7 novembre 
2003, auprés de la Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris 
Cedex 15. ; il contient la sequence d’ADNc correspondant a l’extrémité 3’non codante du génome de la souche de 
SARS-CoV issue du prélévement répertorié sous le n° 031589, telle que définie ci-dessus, laquelle séquence 
correspondant a celle située entre le nucléotide en position 28933 a 29727 (SEQ ID NO :40), en référence a la 
séquence Genbank n° d’accés AY274119.3, se termine par une série de nucléotides a., 

- le plasmide d’expression dénommé plV2.3N, contenant un fragment d’ADNc codant pour une fusion C-terminale 
de la protéine N (SEQ ID NO: 37) avec une étiquette polyhistidine, 

- le plasmide d’expression dénommé plV2.3S., contenant un fragment d’ADNc codant pour une fusion C-terminale 
du fragment correspondant aux positions 475 a 1193 de la séquence en acides aminés de la protéine S (SEQ ID 
NO : 3) avec une étiquette polyhistidine, 

- le plasmide d’expression plV2.3S, , contenant un fragment d’ADNc codant pour une fusion C-terminale du fragment 
correspondant aux positions 14 a 1193 de la séquence en acides aminés de la protéine S (SEQ ID NO: 3) avec 
une étiquette polyhistidine, 

- le plasmide d’expression dénommé plV2.4N, contenant un fragment d’ADNc codant pour une fusion N-terminale 
de la protéine N (SEQ ID NO: 3) avec une étiquette polyhistidine, 

- le plasmide d’expression dénommé plV2.4S¢- ou plV2.4S,, contenant un insert codant pour une fusion N-terminale 
du fragment correspondant aux positions 475 a 1193 de la séquence en acides aminés de la protéine S (SEQ ID 
NO : 3) avec une étiquette polyhistidine, et 

- — le plasmide d’expression dénommé plV2.4S, contenant un fragment d’ADNc codant pour une fusion N-terminale 
du fragment correspondant aux positions 14 a 1193 de la séquence en acides aminés de la protéine S (SEQ ID 
NO : 3) avec une étiquette polyhistidine. 


[0058] Selon une disposition avantageuse du plasmide d’expression tel que défini ci-dessus, il est compris dans une 
souche bactérienne qui a été déposée sous le n° I- 3117, le 23 octobre 2003, auprés de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

[0059] Selon une autre disposition avantageuse du plasmide d’expression tel que défini ci-dessus, il est compris dans 
une souche bactérienne qui a été déposée sous le n° I- 3118, le 23 octobre 2003, auprés de la Collection Nationale de 
Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. 

[0060] Selon une autre disposition du plasmide d’expression tel que défini ci-dessus, il est compris dans une souche 
bactérienne qui a été déposée a la CNCM, 25 rue du Docteur Roux, 75724 Paris Cedex 15 sous les numéros suivants : 


a) souche n° I- 3118, déposée le 23 octobre 2003, 
b) souche n° I- 3019, déposée le 12 mai 2003, 

c) souche n° I- 3020, déposée le 12 mai 2003, 

d) souche n°l-3059, déposée le 20 juin 2003, 

e) souche n° I-3323, déposée le 22 novembre 2004, 
f) souche n° |-3324, déposée le 22 novembre 2004, 
g) souche n° |-3326, déposée le 1" décembre 2004, 
h) souche n° I-3327, déposée le 1&° décembre 2004, 
i) souche n° I-3332, déposée le 1" décembre 2004, 
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j) souche n° |-3333, déposée le 1" décembre 2004, 
k) souche n°l-3334, déposée le 1°" décembre 2004, 
l) souche n° 1-3335, déposée le 1°" décembre 2004, 
m) souche n° I-3336, déposée le 1&" décembre 2004, 
n) souche n° I-3337, déposée le 1" décembre 2004, 
0) souche n° I-3338, déposée le 2 décembre 2004, 

p) souche n° I-3339, déposée le 2 décembre 2004, 

q) souche n° I-3340, déposée le 2 décembre 2004, 

r) souche n° I-3341, déposée le 2 décembre 2004. 


YeEewrmewrm a 


[0061] Les Inventeurs décrivent également un insérat d’acide nucléique d’origine virale, caractérisé en ce qu’il est 
contenu dans I’une quelconque des souches telles que définies ci-dessus en a)-r). 

[0062] Les Inventeurs décrivent également un acide nucléique comportant un géne synthétique permettant une ex- 
pression optimisée de la protéine S dans des cellules eucaryotes, caractérisé en ce qu’il posséde la sequence SEQ ID 
NO: 140. 

[0063] Les Inventeurs décrivent également un vecteur d’expression comportant un acide nucléique comportant un 
géne synthétique permettant une expression optimisée de la protéine S, lequel vecteur est contenu dans la souche 
bactérienne déposée a la CNCM, le 1&° décembre 2004, sous le n°I-3333. 

[0064] Selon un mode de réalisation dudit vecteur d’expression, il s’agit d’un vecteur viral, sous forme de particule 
virale ou sous forme de génome recombinant. 

[0065] Selon une disposition avantageuse de ce mode de réalisation, il s’agit d’une particule virale recombinante ou 
d’un génome viral recombinant susceptible d’étre obtenu par transfection d’un plasmide selon les alinéas g), h) et k) a 
r) tels que définis ci-dessus, dans un systéme cellulaire approprié, c’est-a-dire, par exemple, des cellules transfectées 
avec un ou plusieurs autres plasmide(s), destinés a trancomplémenter certaines fonctions du virus délétées dans le 
vecteur et nécessaires a la formation des particules virales. 

[0066] On entend ici par « famille de la protéine S » la protéine S complete, son ectodomaine et des fragments de 
cet ectodomaine qui sont de préférence produits dans un systeme eucaryote. 

[0067] Les Inventeurs décrivent également un vecteur lentiviral codant pour un polypeptide de la famille de la protéine 
S, telle que définie ci-dessus. 

[0068] Les Inventeurs décrivent également un virus rougeole recombinant codant pour un polypeptide de la famille 
de la protéine S, telle que définie ci-dessus. 

[0069] Les Inventeurs décrivent également un virus vaccine recombinant codant pour un polypeptide de la famille de 
la protéine S, telle que définie ci-dessus. 

[0070] Les Inventeurs décrivent également l'utilisation d’un vecteur selon les alinéas e) a r) tels que définis ci-dessus, 
ou d’un vecteur comportant un géne synthétique de la protéine S, tel que défini ci-dessus, pour la production, en systeme 
eucaryote, de la protéine S du coronavirus associé au SRAS, ou d’un fragment de cette protéine. 

[0071] Les Inventeurs décrivent également une méthode de production de la protéine S en systeme eucaryote, com- 
portant une étape de transfection de cellules eucaryotes en culture par un vecteur choisi parmi les vecteurs contenus 
dans les souches bactériennes mentionnées aux alinéas e) ar) ci-dessus ou un vecteur comportant un géne synthétique 
permettant une expression optimisée de la protéine S. 

[0072] Les Inventeurs décrivent également une banque d’ADNc caractérisée en ce qu’elle comprend des fragments 
tels que définis ci-dessus, en particulier des fragments d’amplification ou des fragments de restriction, clonés dans un 
vecteur recombinant, notamment un vecteur d’expression (banque d’expression). 

[0073] LesInventeurs décrivent également des cellules, notamment des cellules procaryotes, modifiées par un vecteur 
recombinant tel que défini ci-dessus. 

[0074] Les Inventeurs décrivent également une cellule eucaryote génétiquement modifiée exprimant une protéine ou 
un polypeptide tels que définis ci-aprés. Bien évidemment, les termes "cellule eucaryote génétiquement modifiée" ne 
désignent pas une cellule modifiée par un virus sauvage. 

[0075] Selon un mode de réalisation avantageux de ladite cellule, elle est susceptible d’étre obtenue par transfection 
par l’un quelconque des vecteurs mentionnés aux alinéas k) a n) ci-dessus. 

[0076] Selon une disposition avantageuse de ce mode de réalisation, il s’agit de la cellule FRNK4-Ssol-30, déposée 
a la CNCM le 22 novembre 2004, sous le n°I-3325. 

[0077] Les vecteurs recombinants tels que définis ci-dessus et les cellules transformées par lesdits vecteurs d’ex- 
pression sont avantageusement utilisés pour la production des protéines et des peptides correspondants. Les banques 
d’expression dérivées desdits vecteurs, ainsi que les cellules transformées par lesdites banques d’expression sont 
avantageusement utilisées pour identifier les épitopes immunogénes (épitopes B et T) des protéines du coronavirus 
associé au SRAS. 

[0078] Les Inventeurs décrivent également des protéines et des peptides purifiées ou isolées, caractérisés en ce qu’ils 
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sont codés par le polynucléotide ou l’un de ses fragments tels que définis ci-dessus. 
[0079] Selon un mode de réalisation avantageux, ladite protéine est sélectionnée dans le groupe constitué par : 


- la protéine S de séquence SEQ ID NO :3 ou son ectodomaine 

- la protéine E de séquence SEQ ID NO :14 

- la protéine M de séquence SEQ ID NO :17 

- la protéine N de séquence SEQ ID NO: 37 

- les protéines codées par les ORFs : ORF1a, ORF1b, ORF3, ORF4 et ORF7 a ORF11, ORF 13 et ORF 14 de 
séquence respectivement, SEQ ID NO :74, 75, 10, 12, 22, 24, 26, 28, 30, 33 et 35. 


[0080] On utilisera ci-aprés indifféremment les termes « ectodomaine de la protéine S » et « forme soluble de la 
protéine S ». 

[0081] Selon un mode de réalisation avantageux, ledit polypeptide est constitué des acides aminés correspondant 
aux positions 1 a 1193 de la séquence en acides aminés de la protéine S 

[0082] Selon un autre mode de réalisation avantageux, ledit peptide est sélectionné dans le groupe constitué par : 


a) les peptides correspondant aux positions 14a 1193 et475a 1193 dela séquence en acides aminés de la protéine S, 
b) les peptides correspondant aux positions 2 a 14 (SEQ ID NO : 69) et 100 a 221 de la séquence en acides aminés 
de la protéine M ; ces peptides correspondent respectivement al’ectodomaine et a l’endodomaine de la protéine M, et 
c) les peptides correspondant aux positions 1 a 12 (SEQ ID NO: 70) et 53 a 76 (SEQ ID NO: 71) de la séquence 
en acides aminés de la protéine E ; ces peptides correspondent respectivement a l’ectodomaine et a l’extrémité C- 
terminale de la protéine E, et 

d) les peptides de 5 a 50 acides aminés consécutifs, de préférence de 10 a 30 acides aminés, inclus ou chevauchant 
partiellement ou totalement la séquence des peptides tels que définis en a), b) ou c). 


[0083] Les Inventeurs décrivent également un peptide caractérisé en ce qu’il presente une séquence de 7 a 50 acides 
aminés incluant un résidu d’acide aminé sélectionné dans le groupe constitué par : 


-  lalanine située en position 2552 de la séquence en acides aminés de la protéine codée par l'ORF 1a. 

- lasérine située en position 577 de la sequence en acides aminés de la protéine S de la souche de SARS-CoV telle 
que définie ci-dessus, 

-  laglycine en position 11 de la séquence en acides aminés de la protéine codée par l'ORF3 de la souche de SARS- 
CoV telle que définie ci-dessus, 

- la sérine en position 154 de la séquence en acides aminés de la protéine M de la souche de SARS-CoV telle que 
définie ci-dessus. 


[0084] Les Inventeurs décrivent également un anticorps ou un fragment d’anticorps polyclonal ou monoclonal, sus- 
ceptible d’étre obtenu par immunisation d’un animal avec un vecteur recombinant tel que défini ci-dessus, une banque 
d’ADNc telle que définie ci-dessus ou bien une protéine ou un peptide tels que définis ci-dessus, caractérisé en ce qu’il 
se lie avec l’une au moins des protéines codées par le SARS-CoV telles que définies ci-dessus. 

[0085] Les Inventeurs décrivent des anticorps polyclonaux, des anticorps monoclonaux, les anticorps chimériques 
tels que les anticorps humanisés, ainsi que leurs fragments (Fab, Fv, scFv). 

[0086] Les Inventeurs décrivent également un hybridome produisant un anticorps monoclonal contre la protéine N, 
caractérisé en ce qu’il est choisi parmi les hybridomes suivants : 


- — l’hybridome produisant l’anticorps monoclonal 87, déposé a la CNCM le 1°" décembre 2004 sous le numéro I-3328, 
-  I’hybridome produisant l’anticorps monoclonal 86, déposé a la CNCM le 1°" décembre 2004 sous le numéro I-3329, 
-  l'hybridome produisant|’anticorps monoclonal 57, déposé ala CNCM le 1&" décembre 2004 sous le numéro I-3330, et 
-  l’hybridome produisant l’anticorps monoclonal 156, déposé ala CNCM le 1° décembre 2004 sous le numéro I-3331. 


[0087] Les Inventeurs décrivent également un anticorps ou fragment d’anticorps polyclonal ou monoclonal dirigé 
contre la protéine N, caractérisé en ce qu’il est produit par un hybridome tel que défini ci-dessus. 

[0088] On entend par anticorps chimérique, relativement a un anticorps d’une espéce animale particuliére ou d’une 
classe particuliére d’anticorps, un anticorps comprenant tout ou partie d’une chaine lourde et/ou d’une chaine légére 
d’un anticorps d’une autre espéce animale ou d’une autre classe d’anticorps. 

[0089] Onentend par anticorps humanisé une immmunoglobuline humaine dans laquelle les résidus des CDRs (Com- 
plementary-Determining Regions) qui forment le site de liaison a l’antigene sont remplacés par ceux d’un anticorps 
monoclonal non-humain possédant la spécificité, l’affinité ou l’activité recherchées. Par comparaison avec les anticorps 
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non-humains, les anticorps humanisés sont moins immunogénes et possédent une demi-vie prolongée chez l’Homme 
car ils ne possédent qu’une faible proportion de séquences non-humaines étant donné que la quasi-totalité des résidus 
des régions FR (Framework) et de la région constante (Fc) de ces anticorps sont ceux d’une séquence consensus 
d’immunoglobulines humaines. 

[0090] Les Inventeurs décrivent également une puce ou filtre a protéine, caractérisé en ce qu’il comprend une protéine, 
un peptide ou bien un anticorps tels que définis ci-dessus. 

[0091] Les puces a protéine sont préparées par les méthodes classiques, connues en elles-mémes. Parmi les supports 
appropriés sur lesquels peuvent étre immobilisés des protéines, on peut citer ceux en matiére plastique ou en verre, 
notamment sous la forme de microplaques. 

[0092] La présente invention a également pour objet des réactifs dérivés de la souche isolée de coronavirus associé 
au SRAS, issue du prélévement répertorié sous le n° 031589, utiles pour l’étude et le diagnostic de l’infection provoquée 
par un coronavirus associé au SRAS, lesquels réactifs sont sélectionnés dans le groupe constitué par une souche isolée 
de coronavirus et un polynucléotide tels que définis ci-dessus. 

[0093] Les Inventeurs décrivent également des réactifs dérivés de la souche isolée de coronavirus associé au SRAS, 
issue du prélévement répertorié sous le n° 031589, utiles pour I’étude et le diagnostic de l’infection provoquée par un 
coronavirus associé au SRAS, lesquels réactifs sont sélectionnés dans le groupe constitué par : 


(a) une paire d’amorces, une sonde ou une puce a ADN telles que définies ci-dessus, 
(b) un vecteur recombinant ou une cellule modifiée tels que définis ci-dessus, 

(c) une protéine ou un peptide tel que défini ci-dessus, 

(d) un anticorps ou fragment d’anticorps tels que définis ci-dessus, et 

(e) une puce a protéine telle que définie ci-dessus. 


[0094] Ces différents réactifs sont préparés et utilisés selon les techniques classiques de biologie moléculaire et 
d’immunologie, en suivant les protocoles standards tels que ceux décrits dans Current Protocols in Molecular Biology 
(Frederick M. AUSUBEL, 2000, Wiley and Son Inc., Library of Congress, USA), dans Current Protocols in Immunology 
(John E. Cologan, 2000, Wiley and Son Inc. Library of Congress, USA) et dans Antibodies : A Laboratory Manual (E. 
Howell and D Lane, Cold Spring Harbor Laboratory, 1988). 

[0095] Les fragments d’acide nucléique selon l’invention sont préparés et utilisés selon les techniques classiques 
telles que définies ci-dessus. Les peptides et les protéines sont préparés par les techniques d’ADN recombinant, connues 
de Homme du métier, notamment a l’aide des vecteurs recombinants tels que définis ci-dessus. Alternativement, les 
peptides peuvent étre préparés par les techniques classiques de synthése en phase solide ou liquide, connues de 
Homme du métier. 

[0096] Les anticorps polyclonaux sont préparés par immunisation d’un animal approprié avec une protéine ou un 
peptide tels que définis ci-dessus, éventuellement couplé ala KLH ou a l’albumine et/ou associé a un adjuvant approprié 
tel que l’adjuvant de Freund (complet ou incomplet) ou I’hydroxyde d’alumine ; aprés obtention d’un titre en anticorps 
satisfaisant, les anticorps sont récoltés par prélevement du sérum des animaux immunisés et enrichis en IgG par 
précipitation, selon les techniques classiques, puis les IgG spécifiques des protéines du SARS-CoV sont éventuellement 
purifiées par chromatographie d’affinité sur une colonne appropriée sur laquelle sont fixés ledit peptide ou ladite protéine, 
tels que définis ci-dessus, de fagon a obtenir une préparation d’lgG monospécifiques. 

[0097] Les anticorps monoclonaux sont produits a partir d’hybridomes obtenus par fusion de lymphocytes B d’un 
animal immunisé par une protéine ou un peptide tels que définis ci-dessus avec des myélomes, selon la technique de 
Kohler et Milstein (Nature, 1975, 256, 495-497) ; les hybridomes sont cultivés in vitro, notamment dans des fermenteurs 
ou produits in vivo, sous forme d’ascite ; alternativementlesdits anticorps monoclonaux sont produits par génie génétique 
comme décrit dans le brevet américain US 4,816,567. 

[0098] Les anticorps humanisés sont produits par des méthodes générales comme celles décrites dans la Demande 
Internationale WO 98/45332. 

[0099] Les fragments d’anticorps sont produits a partir des régions V,, et V, clonées, a partir des ARNm d’hybridomes 
ou de lymphocytes spléniques d’une souris immunisée ; par exemple, les fragments Fv, scFv ou Fab sont exprimés a 
la surface de phages filamenteux selon la technique de Winter et Milstein (Nature, 1991, 349, 293-299) ; aprés plusieurs 
étapes de sélection, les fragments d’anticorps spécifiques de l’antigéne sont isolés et exprimés dans un systéme d’ex- 
pression approprié, par les techniques classiques de clonage et d’expression d’ADN recombinant. 

[0100] Les anticorps ou leur fragments tels que définis ci-dessus, sont purifiés par les techniques classiques connues 
de Homme du meétier, telles que la chromatographie d’affinité. 

[0101] La présente invention a en outre pour objet l'utilisation d’un produit sélectionné dans le groupe constitué par : 
une souche isolée de coronavirus et un polynucléotide tels que définis ci-dessus, pour la préparation d’un réactif de 
détection et éventuellement de génotypage/sérotypage, d’un coronavirus associé au SRAS, 

[0102] Les Inventeurs décrivent en outre |’utilisation d’un produit sélectionné dans le groupe constitué par : une paire 
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d’amorces, une sonde, une puce a ADN, un vecteur recombinant, une cellule modifiée, une protéine ou un peptide, un 
anticorps ou un fragment d’anticorps et une puce a protéine tels que définis ci-dessus, pour la préparation d’un réactif 
de détection et éventuellement de génotypage/sérotypage, d’un coronavirus associé au SRAS. 

[0103] Les protéines etles peptides, qui sont aptes a étre reconnus et/ou a induire la production d’anticorps spécifiques 
du coronavirus associé au SRAS, sont utiles pour le diagnostic de l’infection par un tel coronavirus ; l'infection est 
détectée, par une technique appropriée- notamment EIA, ELISA, RIA, immunofluorescence-, a partir d’un échantillon 
biologique prélevé chez un individu susceptible d’étre infecté. 

[0104] Selon une disposition avantageuse de ladite utilisation, lesdites protéines sont sélectionnées dans le groupe 
constitué par les protéines S, E, M et/ou N et les peptides tels que définis ci-dessus. 

[0105] Les protéines S, E, M et/ou N et les peptides dérivés de ces protéines tels que définis ci-dessus, par exemple 
la protéine N, sont utilisées pour le diagnostic indirect d’une infection a coronavirus associé au SRAS (diagnostic 
sérologique ; détection d’anticorps spécifiques du SARS-CoV), notamment par une méthode immunoenzymatique (ELI- 
SA). 

[0106] Les anticorps et les fragments d’anticorps tels que définis ci-dessus, notamment ceux dirigés contre les pro- 
téines S, E, Met/ou N etles peptides dérivés tels que définis ci-dessus, sont utiles pour le diagnostic direct d’une infection 
a coronavirus associé au SRAS ; la détection de protéine(s) du SARS-CoV est réalisée par une technique appropriée, 
notamment EIA, ELISA, RIA, immunofluorescence a partir d’un échantillon biologique prélevé chez un individu suscep- 
tible d’étre infecté. 

[0107] Les Inventeurs décrivent également une méthode de détection d’un coronavirus associé au SRAS, a partir 
d’un échantillon biologique, laquelle méthode est caractérisée en ce qu’elle comprend au moins : 


(a) la mise en contact dudit échantillon biologique avec au moins un anticorps ou un fragment d’anticorps, une 
protéine, un peptide ou bien une puce ou un filtre a protéine ou a peptide tels que définis ci-dessus, et 

(b) la révélation par tout moyen approprié des complexes antigéne-anticorps formés en (a), par exemple par EIA, 
ELISA, RIA, ou par immunofluorescence. 


[0108] Selon un mode de mise en oeuvre avantageux dudit procédé |’étape (a) comprend : 


(a1) la mise en contact dudit échantillon biologique avec au moins un premier anticorps ou un fragment d’anticorps 
qui est fixé sur un support approprié, notamment une microplaque, 

(a>) le lavage de la phase solide, et 

(a3) l'addition d’au moins un second anticorps ou un fragment d’anticorps, different du premier, ledit anticorps ou 
fragment d’anticorps étant éventuellement marqué de facgon appropriée. 


[0109] Ce procédé qui permet de capturer les particules virales présentes dans I’échantillon biologique est également 
dénommeé procédé d’immunocapture. 
[0110] Par exemple : 


- |’étape (a,) est réalisée avec au moins un premier anticorps monoclonal ou polyclonal ou un fragment de ceux-ci, 
dirigé contre la protéine S, M, et/ou E, et/ou un peptide correspondant a l’ectodomaine de l'une de ces protéines 
(peptides M2-14 ou E1-12) 

-  l'étape (a3) est réalisée avec au moins un anticorps ou un fragment d’anticorps dirigé contre un autre epitope de la 
méme protéine ou de préférence contre une autre protéine, de maniére préférée contre une protéine interne telle 
que la nucléoprotéine N ou l’endodomaine de la protéine E ou M, de maniére encore plus préférée il s’agit d’anticorps 
ou de fragments d’anticorps dirigés contre la protéine N qui est tres abondante dans la particule virale ; lorsqu’un 
anticorps ou un fragment d’anticorps dirigé contre une protéine interne (N) ou contre l’endodomaine des protéines 
E ou M est utilisé, le dit anticorps est incubé en présence de détergent, comme le Tween 20 par exemple, a des 
concentrations de l’ordre de 0,1 %. 

- létape (b) de révélation des complexes antigéne-anticorps formés est réalisée, soit directement a l'aide d’un second 
anticorps marqué par exemple avec de la biotine ou une enzyme appropriée telle que la peroxydase ou la phos- 
phatase alcaline, soit indirectement a l'aide d’un sérum anti-immunoglobulines marqué comme ci-dessus. Les com- 
plexes ainsi formés sont révélés a l'aide d’un substrat approprié. 


[0111] Selonune mise en oeuvre préférée de cet aspect de l’invention, l’échantillon biologique est mélangé al’anticorps 
monoclonal de révélation préalablement a sa mise en contact avec les anticorps monoclonaux de capture. Le cas 
échéant, le mélange sérum-anticorps de révélation est incubé pendant au moins 10 minutes a température ambiante 
avant d’étre appliqué sur la plaque. 

[0112] La présente invention a également pour objet un test d’immunocapture destiné a détecter une infection par le 
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coronavirus associé au SRAS par détection de la nucléoprotéine native (protéine N), en particulier caractérisé en ce 
que l’anticorps utilisé pour la capture de la nucléoprotéine virale native est un anticorps monoclonal spécifique de la 
région centrale et/ou d’un épitope conformationnel. 

[0113] Selon un mode de réalisation dudit test, l’anticorps utilisé pour la capture de la protéine N est l’anticorps 
monoclonal Acm87, produit par I’hybridome déposé a la CNCM le 1°" décembre 2004 sous le numéro |-3328. 

[0114] Selon un autre mode de réalisation dudit test d’immunocapture, l’anticorps utilisé pour la capture de la protéine 
N est l’anticorps monoclonal Acm86, produit par Il’hybridome déposé a la CNCM le 1" décembre 2004 sous le numéro 
I-3329. 

[0115] Selon un autre mode de réalisation dudit test d’immunocapture, les anticorps monoclonaux Acm86 et Acm87 
sont utilisés pour la capture de la protéine N. 

[0116] Dans les tests d’immunocapture selon l’invention, on peut utiliser pour la révélation de la protéine N, l’anticorps 
monoclonal Acm57, produit par I’hybridome déposé a la CNCM le 1° décembre 2004 sous le numéro I-3330, ledit 
anticorps étant conjugué a une molécule ou une particule révélatrice. 

[0117] Conformément audit test d’immunocapture, une combinaison des anticorps Acm57 et Acm87, conjugués a 
une molécule ou une particule révélatrice, est utilisée pour la révélation de la protéine N. 

[0118] Une molécule révélatrice peut étre un atome radioactif, un colorant, une molécule fluorescente, un fluorophore, 
une enzyme ; une particule révélatrice peut étre, par exemple : de l’or colloidal, une particule magnétique ou une bille 
de latex. 

[0119] La présente invention a également pour objet un réactif de détection d’un coronavirus associé au SRAS, 
caractérisé en ce qu’il est sélectionné dans le groupe constitué par une souche isolée de coronavirus telle que définie 
ci-dessus et un polynucléotide tel que défini ci-dessus. 

[0120] Les Inventeurs décrivent également un réactif de détection d’un coronavirus associé au SRAS, caractérisé en 
ce qu’il est sélectionné dans le groupe constitué par : 


(a) une paire d’amorces ou une sonde telles que définies ci-dessus, 

(b) un vecteur recombinant tel que défini ci-dessus ou une cellule modifiée telle que définie ci-dessus, 

(c) un anticorps ou un fragment d’anticorps tel que défini ci-dessus, 

(d) une combinaison d’anticorps comprenant les anticorps monoclonaux Acm86 et/ou Acm87, et l’anticorps mono- 
clonal Acm57, telle que définie ci-dessus, 

(e) une puce ou un filtre tels que définis ci-dessus. 


[0121] Les Inventeurs décrivent également une méthode de détection d’une infection par un coronavirus associé au 
SRAS, a partir d’un échantillon biologique, par ELISA IgG indirect utilisant la protéine N, laquelle méthode est caractérisée 
en ce que les plaques sont sensibilisées par une solution de protéine N a une concentration comprise entre 0,5 et 
4pg/mL, de préférence 2.9/mL, dans un tampon PBS 10mM pH 7,2, rouge de phénol a 0,25mL /L. 

[0122] Les Inventeurs décrivent, en outre, une méthode de détection d’une infection par un coronavirus associé au 
SRAS, a partir d’un échantillon biologique, par ELISA double épitope, caractérisée en ce que le sérum a tester est 
mélangé a l’antigéne de révélation, ledit mélange étant ensuite mis au contact de l’antigéne fixé sur un support solide. 
[0123] Selon une variante des tests de détection des coronavirus associé au SRAS, ces tests combinent un ELSA 
utilisant la protéine N, et un autre ELSA utilisant la protéine S, tel que décrit plus bas. 

[0124] LesInventeurs décrivent aussi un complexe immun formé d’un anticorps ou d’un fragment d’anticorps polyclonal 
ou monoclonal tel que défini ci-dessus, et d’une protéine ou d’un peptide du coronavirus associé au SRAS. 

[0125] La présent invention a en outre pour objet un kit de détection d’un coronavirus associé au SRAS, caractérisé 
ence qu'il comprend au moins un réactif sélectionné dans le groupe constitué par une souche isolée de coronavirus et 
un polynucléotide. 

[0126] Les Inventeurs décriventa en outre un kit de détection d’un coronavirus associé au SRAS, caractérisé en ce 
qu’il comprend au moins un réactif sélectionné dans le groupe constitué par : une paire d’amorces, une sonde, une puce 
a ADN ou a ARN, un vecteur recombinant, une cellule modifiée, une protéine ou un peptide, un anticorps, et une puce 
a protéine tels que définis ci-dessus. 

[0127] Les Inventeurs décrivent en outre, une composition immunogéne, caractérisée en ce qu’elle comprend au 
moins un produit sélectionné dans le groupe constitué par : 


a) une protéine ou un peptide tels que définis ci-dessus, 
b) un polynucléotide de type ADN ou ARN ou Il’un de ses fragments représentatifs tels que définis ci-dessus, de 


séquence choisie parmi : 


(i) la sequence SEQ ID NO: 1 ou son équivalent ARN 
(ii) la sequence hybridant dans des conditions de forte stringence avec la séquence SEQ ID NO: 1, 
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(iii) la séquence complémentaire de laséquence SEQ ID NO : 1 ou dela séquence hybridant dans des conditions 
de forte stringence avec la séquence SEQ ID NO: 1, 

(iv) la séquence nucléotidique d’un fragment représentatif du polynucléotide tel que défini en (i), (ii) ou (iii), 
(v) la séquence telle que définie en (i), (ii), (iii) ou (iv), modifiée, et 


c) un vecteur d’expression recombinant comprenant un polynucléotide tel que défini en b), et 
d) une banque d’ADNc telle que définie ci-dessus, 


ladite composition immunogéne étant capable d’induire une immunité humorale ou cellulaire protectrice spécifique du 
coronavirus associé au SRAS, notammentla production d’un anticorps dirigé contre un épitope spécifique du coronavirus 
associé au SRAS. 

[0128] Les protéines et les peptides tels que définis ci-dessus, notamment les protéines S, M, E et/ou N et les peptides 
dérivés, ainsi que les molécules d’acide nucléique (ADN ou ARN) codant lesdites protéines ou lesdits peptides, sont de 
bons candidats vaccin et peuvent étre utilisées dans des compositions immunogénes pour la production d’un vaccin 
contre le coronavirus associé au SRAS. 

[0129] Selon un mode de réalisation avantageux des compositions définies ci-dessus, elles contiennent en outre, au 
moins un véhicule pharmaceutiquement acceptable et éventuellement des substances porteuses et/ou des adjuvants. 
[0130] Les véhicules pharmaceutiquement acceptables, les substances porteuses et les adjuvants sont ceux classi- 
quement utilisés. 

[0131] Les adjuvants sont avantageusement choisis dans le groupe constitué par des émulsions huileuses, de la 
saponine, des substances minérales, des extraits bactériens, de I’hydroxyde d’alumine et le squaléne. 

[0132] Les substances porteuses sont avantageusement sélectionnées dans le groupe constitué par des liposomes 
unilamellaires, des liposomes multilamellaires, des micelles de saponine ou des microsphéres solides de nature sac- 
charidique ou aurifére. 

[0133] _Lescompositions telles que définies ci-dessus, sont administrées par voie générale, notamment intramusculaire 
ou sous-cutanée ou bien par voie locale notamment nasale (aérosol). 

[0134] Les Inventeurs décrivent également l'utilisation d’une protéine ou d’un peptide isolé ou purifié présentant une 
séquence sélectionnée dans le groupe constitué par les sequences SEQ ID NO: 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour former un complexe immun avec un anticorps dirigé spécifiquement contre un 
épitope du coronavirus associé au SRAS. 

[0135] Les Inventeurs décrivent également un complexe immun formé d’une protéine ou d’un peptide isolé ou purifié 
présentant une séquence sélectionnée dans le groupe constitué par les sequences SEQ ID NO: 3, 10, 12, 14, 17, 22, 
24, 26, 28, 30, 33, 35, 37, 69, 70, 71, 74 et 75, et d’un anticorps dirigé spécifiquement contre un épitope du coronavirus 
associé au SRAS. 

[0136] Les Inventeurs décrivent également l'utilisation d’une protéine ou d’un peptide isolé ou purifié présentant une 
séquence sélectionnée dans le groupe constitué par les sequences SEQ ID NO: 3, 10, 12, 14, 17, 22, 24, 26, 28, 30, 
33, 35, 37, 69, 70, 71, 74 et 75 pour induire la production d’un anticorps capable de reconnaitre spécifiquement un 
épitope du coronavirus associé au SRAS. 

[0137] Les Inventeurs décrivent également l'utilisation d’un polynucléotide isolé ou purifié présentant une séquence 
sélectionnée dans le groupe constitué par les sequences SEQ ID NO: 1, 2, 4, 7, 8, 13, 15, 16, 18, 19, 20, 31, 36 et 38 
pour induire la production d’un anticorps dirigé contre la protéine codée par ledit polynucléotide et capable de reconnaitre 
spécifiquement un épitope du coronavirus associé au SRAS 

[0138] Les Inventeurs décrivent également des anticorps monoclonaux reconnaissant la protéine S native d’un coro- 
navirus associé au SRAS. 

[0139] Les Inventeurs décrivent également I’utilisation d’une protéine ou d’un polypeptide de la famille de la protéine 
S, telle que définie ci-dessus, ou d’un anticorps reconnaissant la protéine S native, tel que défini ci-dessus, pour détecter 
une infection par un coronavirus associé au SRAS, a partir d’un échantillon biologique. 

[0140] Les Inventeurs décrivent également une méthode de détection d’une infection par un coronavirus associé au 
SRAS, a partir d’un échantillon biologique, caractérisée en ce que la détection est effectuée par ELISA utilisant la protéine 
S recombinante, exprimée dans un systéme eucaryote. 

[0141] Selon un mode de mise en oeuvre avantageux de ladite méthode, il s’agit d'une méthode par ELISA double 
épitope, et le sérum a tester est mélangé a l’antigéne de révélation, ledit mélange étant ensuite mis au contact de 
l’antigéne fixé sur un support solide. 

[0142] Les Inventeurs décrivent aussi un complexe immun formé d’un anticorps ou d’un fragment d’anticorps mono- 
clonal reconnaissant la protéine S native, et d’une protéine ou d’un peptide du coronavirus associé au SRAS. 

[0143] Les Inventeurs décrivent également un complexe immun formé d’une protéine ou d’un polypeptide de la famille 
de la protéine S, telle que définie ci-dessus, et d’un anticorps dirigé spécifiquement contre un épitope du coronavirus 
associé au SRAS. 
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[0144] Les Inventeurs décrivent en outre un kit ou coffret de détection d’un coronavirus associé au SRAS, caractérisé 
en ce qu’il comprend au moins un réactif sélectionné dans le groupe constitué par : une protéine ou polypeptide de la 
famille de la protéine S, telle que définie ci-dessus, un acide nucléique codant pour une protéine ou polypeptide de la 
famille de la protéine S, telle que définie ci-dessus, une cellule exprimant une protéine ou polypeptide de la famille de 
la protéine S, telle que définie ci-dessus, ou un anticorps reconnaissant la protéine S native d’un coronavirus associé 
au SRAS. 

[0145] Les Inventeurs décrivent une composition immunogéne et/ou vaccinale, caractérisée en ce qu’elle comprend 
un polypeptide ou une protéine recombinante de la famille de la protéine S, telle que définie ci-dessus, obtenu dans un 
systéme d’expression eucaryote. 

[0146] Les Inventeurs décrivent également une composition immunogéne et/ou vaccinale, caractérisée en ce qu'elle 
comprend un vecteur ou virus recombinant, exprimant une protéine ou un polypeptide de la famille de la protéine S, 
telle que définie ci-dessus. 

[0147] Outre les dispositions qui précédent, l’invention comprend encore d’autres dispositions, qui ressortiront de la 
description qui va suivre, qui se référe a des exemples de mise en oeuvre du polynucléotide représentant le génome 
de la souche de SARS-CoV issue du prélévement répertorié sous le numéro 031589, et des fragments d’ADNc dérivés 
objets de la présente invention, ainsi qu’au Tableau | présentant la liste des séquences : 


Tableau | : Liste des sequences 






















































































numéro d’identification Séquence Position de l’ADNc en Numéro de dépét a la 
référence a Genbank CNCM du plasmide 
AY274119.3 correspondant 
SEQ ID NO: 1 génome de la souche - - 
issue du prélévement 
031589 
SEQ ID NO: 2 ORF-S* 21406-25348 - 
SEQ ID NO:3 Protéine S - - 
SEQ ID NO: 4 ORF-S** 21406-25348 1-3059 
SEQ IDNO:5 fragment Sa 21406-23454 I-3020 
SEQ ID NO:6 fragment Sb 23322-25348 I-3019 
SEQ ID NO:7 ORF-3+ORF-4* 25110-26244 - 
SEQ ID NO: 8 ORF-3+ORF-4** 25110-26244 I-3126 
SEQ ID NO: 9 ORF3 - - 
SEQ ID NO: 10 Protéine ORF-3 - - 
SEQ ID NO: 11 ORF4 - - 
SEQ ID NO: 12 Protéine ORF-4 - - 
SEQ ID NO: 13 ORF-E* 26082-26413 - 
SEQ ID NO: 14 Protéine E - - 
SEQ ID NO: 15 ORF-E** 26082-26413 1-3046 
SEQ ID NO: 16 ORF-M* 26330-27098 - 
SEQ ID NO: 17 Protéine M - - 
SEQ ID NO: 18 ORF-M** 26330-27098 |-3047 
SEQ ID NO: 19 ORF7 a 11* 26977-28218 - 
SEQ ID NO: 20 ORF7 a 11** 26977-28218 1-3125 
SEQ ID NO: 21 ORF7 - - 
SEQ ID NO: 22 Protéine ORF7 - - 
SEQ ID NO: 23 ORF8 - - 








10 


15 


20 


25 


30 


35 


40 


45 


50 


55 


EP 1 694 829 B1 


(suite) 





numéro d’identification 


Séquence 


Position de l’ ADNc en 
référence a Genbank 


Numéro de dépét a la 
CNCM du plasmide 


























































































































AY274119.3 correspondant 

SEQ ID NO: 24 Protéine ORF8 - - 
SEQ ID NO: 25 ORF9 - - 
SEQ ID NO: 26 Protéine ORF9 - - 
SEQ ID NO: 27 ORF10 - - 
SEQ ID NO: 28 Protéine ORF10 - - 
SEQ ID NO: 29 ORF11 - - 
SEQ ID NO: 30 Protéine ORF 11 - - 
SEQ ID NO: 31 OrF1ab 265-21485 - 
SEQ ID NO: 32 ORF 13 28130-28426 - 
SEQ ID NO: 33 Protéine ORF13 - - 
SEQ ID NO: 34 ORF 14 - - 
SEQ ID NO: 35 Protéine ORF 14 28583-28795 - 
SEQ ID NO: 36 ORF-N* 28054-29430 
SEQ ID NO: 37 Protéine N - - 
SEQ ID NO: 38 ORF-N** 28054-29430 1-3048 
SEQ ID NO: 39 5’non-codante** 1-204 1-3124 
SEQ ID NO: 40 3’non-codante** 28933-29727 I-3123 

ORF1ab - 
SEQ ID NO: 41 Fragment LO 30-500 
SEQ ID NO: 42 Fragment L1 211-2260 - 
SEQ ID NO: 43 Fragment L2 2136-4187 - 
SEQ ID NO: 44 Fragment L3 3892-5344 - 
SEQ ID NO: 45 Fragment L4b 4932-6043 - 
SEQ ID NO: 46 Fragment L4 5305-7318 - 
SEQ ID NO: 47 Fragment L5 7275-9176 - 
SEQ ID NO: 48 Fragment L6 9032-11086 - 
SEQ ID NO: 49 Fragment L7 10298-12982 - 
SEQ ID NO: 50 Fragment L8 12815-14854 - 
SEQ ID NO: 51 Fragment L9 14745-16646 - 
SEQ ID NO: 52 Fragment L10 16514-18590 - 
SEQ ID NO: 53 Fragment L11 18500-20602 - 
SEQ ID NO: 54 Fragment L12 20319-22224 - 
SEQ ID NO: 55 Amorce N sens - - 
SEQ ID NO: 56 Amorce N antisens - - 
SEQ ID NO: 57 Amorce Sc sens - - 
SEQ ID NO: 58 Amorce S, sens - - 
SEQ ID NO: 59 Amorce Sc. et S, antisens - - 
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(suite) 
numéro d’identification Séquence Position de l’ADNc en Numéro de dépot a la 
référence a Genbank CNCM du plasmide 
AY274119.3 correspondant 
SEQ ID NO: 60 Amorce sens série 1 28507-28522 - 
SEQ ID NO: 61 Amorce antisens série 1 28774-28759 
SEQ ID NO: 62 Amorce sens série 2 28375-28390 - 
SEQ ID NO: 63 Amorce antisens série 2 28702-28687 - 
SEQ ID NO: 64 Sonde 1/série 1 28561-28586 - 
SEQ ID NO: 65 Sonde 2/série 1 28588-28608 - 
SEQ ID NO: 66 Sonde 1/série 2 28541-28563 - 
SEQ ID NO: 67 Sonde 2/série 2 28565-28589 - 
SEQ ID NO: 68 Amorce ancre 14T 
SEQ ID NO: 69 Peptide M2-14 - - 
SEQ ID NO: 70 Peptide E1-12 - - 
SEQ ID NO: 71 Peptide E53-76 - - 
SEQ ID NO: 72 5’non-codante* 1-204 - 
SEQ ID NO: 73 3’non-codante* 28933-29727 - 
SEQ ID NO: 74 Protéine ORF1a - - 
SEQ ID NO: 75 Protéine ORF1b - - 
SEQ ID NO:76-139 Amorces 
SEQ ID NO:140 Pseudogéne de S 
SEQ ID NO:141-148 amorces 
SEQ ID NO:149 Aa1-13 de S 
SEQ ID NO:150 polypeptide 
SEQ ID NO:151-158 amorces 
* produit d’amplification PCR (amplicon) 
** insert cloné dans le plasmide déposé a la CNCM 
ainsi qu’aux dessins annexés dans lesquels : 











la figure 1 illustre l’analyse par Western-blot de l’expression in vitro des protéines recombinantes N, Sc_ et S; a partir 
des vecteurs d’expression pIVEX. Piste 1 : plV2.3N. Piste 2 : plV2.3S¢. Piste 3 : plV2.3S, . Piste 4 : plV2.4N. Piste 
5 : plV2.4S, ou plV2.4S¢. Piste 6 : plV2.4S, . L’expression de la protéine GFP exprimée a partir du méme vecteur 
est utilisée comme contréle. 

la figure 2 illustre l’analyse par électrophorése en gel de polyacrylamide en conditions dénaturantes (SDS-PAGE) 
et coloration au bleu de Coomassie, de l’expression in vivo de la protéine N a partir des vecteurs d’expression 
pIVEX. La souche d’E.coliBL21(DE3)pDIA17 transformée par les vecteurs pIVEX recombinants est cultivée a 30°C 
dans du milieu LB, en présence ou en l’absence d’inducteur (IPTG 1mM). Piste 1 : plV2.3N Piste 2 : plV2.4N. 

la figure 3 illustre l’analyse par électrophorése en gel de polyacrylamide en conditions dénaturantes (SDS-PAGE) 
et coloration au bleu de Coomassie, de l’expression in vivo des polypeptides S, et Sc a partir des vecteurs d’ex- 
pression pIVEX. La souche d’E.coliBL21(DE3)pDIA17 transformée par les vecteurs pl VEX recombinants est cultivée 
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a 30°C dans du milieu LB, en présence ou en l’absence d’inducteur (IPTG 1mM). Piste 1: plV2.3S, Piste 2: 
plV2.3S,. Piste 3 : plV2.4S, Piste 4: plV2.4S,. 

la figure 4 illustre l’activité antigénique des protéines N, S, et Sc recombinantes produites dans la souche E. coli 
BL21(DE3)pDIA17 transformée par les vecteurs pIlVEX recombinants. A : électrophorése (SDS-PAGE) des lysats 
bactériens. B et C : Westem-blot avec les sérums, provenant d’un méme patient infecté par le SARS-CoV, prélevés 
respectivement 8 jours (B : sérum M12) et 29 jours-(C : sérum M13) aprés le début des sympt6mes du SRAS. Piste 
1: plV2.3N. Piste 2 : plV2.4N. Piste 3 : plV2.3S¢. Piste 4 : plV2.4 S,. Piste 5 : plV2.3S, . Piste 6 : plV2.4S, 

la figure 5 illustre la purification sur colonne Ni-NTA agarose de la protéine N recombinante produite dans la souche 
E. coliBL21(DE3)pDIA17 a partir du vecteur plV2.3N. Piste 1 : Extrait bactérien total. Piste 2 : Extrait soluble. Piste 
3: Extrait insoluble. Piste 4: Extrait déposé sur la colonne Ni-NTA. Piste 5: protéines non-retenues. Piste 6: 
Fractions du pic 1. Piste 7 : Fractions du pic 2. 

la figure 6 illustre la purification de la protéine S, recombinante a partir des corps d’inclusions produits dans la 
souche E. coli BL21(DE3)pDIA17 transformée par le plV2.4S,.A. Traitement au Triton X-100 (2%) : Piste 1 : Extrait 
bactérien total. Piste 2 : Extrait soluble. Piste 3 : Extrait insoluble. Piste 4 : Surnageant aprés traitement au Triton 
X-100 (2 %). Pistes 5 et 6 : Culot aprés traitement au Triton X-100 (2 %).B : Traitement a l’urée 4M, 5M, 6M et 7M 
des extraits solubles et insolubles. 

la figure 7 représente l’immunoempreinte réalisée a l’aide d’un lysat de cellules infectées par le SARS-CoV et d’un 
sérum de patient atteint de pneumopathie atypique. 

la figure 8 représente des immunoempreintes réalisées a l’aide d’un lysat de cellules infectées par le SARS-CoV 
et d’immunsérums de lapins spécifiques de la nucléoprotéine N (A) et de la protéine de spicule S (B). I.S. : sérum 
immun. p.i. : serum pré-immun. L’immunsérum anti-N a été utilisé au 1/50000 et l’immunsérum anti-S au 1/10000. 
la figure 9 illustre la réactivité en ELISA des sérums polyclonaux monospécifiques de lapin dirigés contre la protéine 
N ou le fragment court de la protéine S (S_), vis-a-vis des protéines recombinantes correspondantes utilisées pour 
immunisation. A : lapins P13097, P13081, et P13031 immunisés avec la protéine N recombinante purifié. B : lapins 
P11135, P13042, et P14001 immunisés avec une préparation de corps d’inclusions correspondants au fragment 
court de la protéine S (S,). I.S. : sérum immun. p.i. : sérum pré-immun. 

la figure 10 illustre la réactivité en ELISA de la protéine N recombinante purifiée, vis-a-vis de sérum de patients 
atteints de pneumonie atypique causée par le SARS-CoV. Figure 10a : plaques ELISA préparés avec la protéine 
N ala concentration de 4 g/ml et 2 g/ml. Figure 10b : plaque ELISA préparée avec la protéine N ala concentration 
de 1 pg/ml. Les sérums désignés A, B, D, E, F, G, H correspondent a ceux du Tableau IV. 

la figure 11 illustre amplification par RT-PCR de quantités décroissantes d’ARN synthétique du géne N du SARS- 
CoV (10 4 1 copie), a l’aide des couples d’amorces n° 1 (N/+/28507,N/-/28774) (A) et n° 2 (N/+/28375,N/-/28702) 
(B). T : amplification réalisée en l’absence d’ARN. MW : marqueur d’ADN. 

la figure 12 illustre l’amplification par RT-PCR en temps réel d’ARN synthétique du gene N du SARS-CoV : des 
quantités décroissantes d’ARN synthétique en répliquat (repli. ; pistes 16 a 29) ainsi que de ARN viral dilué au 
1/20x10* (piste 32) ont été amplifiés par RT-PCR en temps réel a l’aide du kit "Light Cycler RNA Amplification Kit 
Hybridization Probes" et des couples d’amorces et de sondes de la série n° 2, dans les conditions décrites a l’exemple 
8. 

la figure 13.1 a 13.70 (figure 13.1 a 13.70) représente la carte de restriction de la sequence SEQ ID NO : 1 corres- 
pondant a l’équivalent ADN du génome de la souche de SARS-CoV issue du prélévement répertorié sous le numéro 
031589. 

la figure 14 montre le résultat du test de sérologie SRAS par ELISA N indirect (1ére série de sérums testés) 

la figure 15 montre le résultat du test de sérologie SRAS par ELISA N indirect (2@me série de sérums testés) 

la figure 16 présente le résultat du test de sérologie SRAS par ELISA N double épitope (1 ére série de sérums testés) 
la figure 17 montre le résultat du test de sérologie SRAS par ELISA N double épitope (2é€me série de sérums testés) 
la figure 18 illustre le test de réactivité des anticorps monoclonaux anti-N par ELISA sur la nucléoprotéine N native 
du SRAS-CoV. Les anticorps ont été testés sous la forme de surnageants de culture d’hybridomes par un ELISA 
indirect utilisant un lysat irradié de cellules VeroE6 infectées par le SRAS-CoV comme antigéne (courbes lysat 
SRAS). Un contréle négatif de réactivité est réalisé pour chaque anticorps sur un lysat de cellules VeroE6 non 
infectées (courbes lysat négatif). Plusieurs anticorps monoclonaux de spécificité connue ont été utilisés comme 
anticorps témoins négatifs : para1-3 dirigé contre les antigénes des virus parainfluenza de type 1-3 (Bio-Rad) et 
grippe B dirigé contre les antigénes du virus de la grippe de type B (Bio-Rad). 

la figure 19 illustre le test de réactivité des anticorps monoclonaux anti-N du SRAS-CoV par ELISA sur les antigénes 
natifs du coronavirus humain 229E (HCoV-229E). Les anticorps ont été testés sous la forme de surnageants de 
culture d’hybridomes par un test ELISA indirect utilisant un lysat de cellules MRC-5 infectées par le coronavirus 
humain 229E comme antigéne (courbes lysat 229E). Un contréle négatif d’immunoréactivité est réalisé pour chaque 
anticorps sur un lysat de cellules MRC-5 non infectées (courbes lysat négatif). L’anticorps monoclonal 5-11H.6 
dirigé contre la protéine S du coronavirus humain 229E (Sizun et al. 1998, J. Virol. Met. 72 : 145-152) est utilisé 
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comme anticorps témoin positif. Les anticorps paral-3 dirigé contre les antigénes des virus parainfluenza de type 
1-3 (Bio-Rad) et grippe B dirigé contre les antigénes du virus de la grippe de type B (Bio-Rad) ont été ajoutés au 
panel des anticorps monoclonaux testés. 

la figure 20 montre un test de réactivité des anticorps monoclonaux anti-N du SRAS-CoV par western blot sur la 
nucléoprotéine N native du SRAS-CoV dénaturée. Un lysat de cellules VeroE6 infectées par le SRAS-CoV a été 
préparé dans le tampon de dépdt selon Laemmli et mis a migrer dans un gel SDS a 12% de polyacrylamide puis 
les protéines ont été transférées sur membrane de PVDF. Les anticorps monoclonaux anti-N testés ont été utilisés 
pour l’immunoessai a la concentration de 0.05 wg/ml. La révélation est faite avec des anticorps anti-lgG(H+L) de 
souris couplés a la peroxydase (NA93IV, Amersham) et le syste me ECL+. Deux anticorps monoclonaux ont été 
utilisés comme témoins négatifs de réactivité : grippe B dirigé contre les antigénes du virus de la grippe de type B 
(Bio-Rad) et para1-3 dirigé contre les antigénes des virus parainfluenza de type 1-3 (Bio-Rad). 

la figure 21 présente les plasmides d’expression en cellules de mammiféres de la protéine S du SRAS-CoV. Le 
cDNA de la S du SRAS-CoV a été inséré entre les sites BamH1 et Xho1 du plasmide d’expression pcDNA3.1(+) 
(Clontech) pour obtenir le plasmide pcDNA-S et entre les sites Nhe1 et Xho1 du plasmide d’expression pCl (Promega) 
pour obtenir le plasmide pCI-S. Les séquences WPRE et CTE ont été insérées dans chacun des deux plasmides 
pcDNA-S et pCI-S entre les sites Xho1 et Xba1 pour obtenir respectivement les plasmides pcDNA-S-CTE, pcDNA- 
S-WPRE, pCI-S-CTE et pCl-S-WPRE. 


SP : peptide signal prédit (aa 1-13) avecle logiciel signalP v2.0 (Nielsen et al., 1997, Protein Engineering, 10 : 1-6) 
TM : région transmembranaire prédite (aa 1196-1218) avec le logiciel TMHMM v2.0 (Sonnhammer et al., 1998, 
Proc. of Sixth Int. Conf. on Intelligent Systems for Molecular Biology, p 175-182, AAAI Press). II faut noter que 
les acides aminés W1194 et P1195 font possiblement partie de la région transmembranaire avec des probabilités 
respectives de 0,13 et 0,42 

P-CMV : promoteur immédiat/précoce du cytomégalovirus. BGH pA: signal de polyadénylation du géne de 
I'hormone de croissance bovine 

SV40 late pA : signal de polyadénylation tardif du virus SV40 

SD/SA : sites donneur et accepteur d’épissage 

WPRE : séquences du "Woodchuck Hepatitis Virus posttranscriptional regulatory element" du virus de I’hépatite 
de la marmotte 

CTE : séquences du "constitutive transport element" du rétrovirus simien de Mason-Pfizer 


la figure 22 illustre l’expression de la protéine S aprés transfection de cellules VeroE6. Des extraits cellulaires ont 
été préparés 48 heures aprés transfection de cellulesVeroE6 par les plasmides pcDNA, pcDNA-S, pCl et pCI-S. 
Des extraits cellulaires ont également été préparés 18 heures aprés infection par le virus recombinant de la vaccine 
VV-TF7.3 et transfection par les plasmides pcDNA ou pcDNA-S. A titre de contréle, des extraits de cellules VeroE6 
ont été préparés 8 heures aprés infection par le SRAS-CoV a une multiplicité d’infection de 3. Ils ont été séparés 
sur un gel SDS a 8% d’acrylamide et analysés par western blot a l’aide d’un anticorps polyclonal de lapin anti-S et 
d’un anticorps polyclonal anti-lgG(H+L) de lapin couplé a la peroxidase (NA934V, Amersham). Une échelle de 
masse moléculaire (kDa) est portée sur la figure. 


SRAS-CoV : extrait de cellules VeroE6 infectées par le SRAS-CoV 
Mock : extrait contréle de cellules non infectées 


la figure 23 illustre l’effet des séquences CTE et WPRE sur l’expression de la protéine S aprés transfection de 
cellules VeroE6 et 293T. Des extraits cellulaires ont été préparés 48 heures aprés transfection de cellulesVeroE6 
(A) ou 293T (B) par les plasmides pcDNA, pcDNA-S, pcDNA-S-CTE, pcDNA-S-WPRE, pCI-S, pCI-S-CTE et pCl- 
S-WPRE, séparés sur un gel SDS a 8% d’acrylamide et analysés par western blot a l’aide d’un anticorps polyclonal 
de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) de lapin couplé a la peroxidase (NA934V, Amersham). 
Une échelle de masse moléculaire (kDa) est portée sur la figure. 


SRAS-CoV : extrait de cellules VeroE6 préparés 8 heures aprés infection par le SRAS-CoV a une multiplicité 
d'infection de 3. 
Mock : extrait contréle de cellules VeroE6 non infectées 


la figure 24 présente des vecteurs lentiviraux défectifs a DNA flap central pour l’expression de la S du SRAS-CoV. 
Le cADN de la protéine S du SRAS-CoV a été cloné sous la forme d’un fragment BamH1-Xho1 dans le plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral défectif TRIP a DNA flap central (Sirven et al, 2001, Mol. Ther., 3: 
438-448) pour obtenir le plasmide pTRIP-S. Les cassettes d’expression optimales constituées du promoteur immé- 
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diat/précoce du virus CMV, d’un signal d’épissage, du cDNA de la S et de l'un ou l'autre des signaux post-transcrip- 
tionnels CTE ou WPRE ont été substituées a la cassette EF1a-EGFP du vecteur d’expression lentiviral défectif a 
DNA FLAP central TRIPAU3-EF1 o (Sirven et al, 2001, Mol. Ther., 3 :438-448) pour obtenir les plasmides pTRIP- 
SD/SA-S-CTE et pTRIP-SD/SA-S-WPRE. 


SP : peptide signal 

TM : région transmembranaire 

P-CMV : promoteur immédiat/précoce du cytomégalovirus 

P-EF1o : promoteur du géne EF 1a 

SD/SA : sites donneur et accepteur d’épissage 

WPRE : séquences du "Woodchuck Hepatitis Virus posttranscriptional regulatory element" du virus de I’hépatite 
de la marmotte 

CTE : séquences du "constitutive transport element" du rétrovirus simien de Mason-Pfizer 
LTR : « Long terminal repeat » 

AU3 : LTR délété des séquences « promoter/enhancer » 

cPPT : « polypurine tract cis-active sequence » 

CTS: « central termination sequence » 


la figure 25 montre l’analyse par western blot de l’expression de la S du SRAS-CovV par des lignées cellulaires 
transduites par les vecteurs lentiviraux TRIP-SD/SA-S-WPRE et TRIP-SD/SA-S-CTE. Des extraits cellulaires ont 
été préparés a partir de lignées FrhK4-S-CTE et FrhK4-S-WPRE établies aprés transduction par les vecteurs 
lentiviraux TRIP-SD/SA-S-CTE et TRIP-SD /SA-S-WPRE respectivement. Ils ont été séparés sur un gel SDS a 8% 
d’acrylamide et analysés par western blot a l’aide d’un anticorps polyclonal de lapin anti-S et d’un conjugué anti- 
IgG(H+L) de lapin couplé a la peroxidase. Une échelle de masse moléculaire (kDa) est portée sur la figure. 


T- : extrait contrdle de cellules FrhK-4 
T+ : extrait de cellules FrhK-4 préparées 24h aprés infection par le SRAS-CoV a une multiplicité d’infection de 3. 


la figure 26 concerne l’analyse de l’expression de polypeptide Ssol par des lignées cellulaires transduites par les 
vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. La sécrétion du polypeptide Ssol a été 
recherchée dans le surnageant d’une série de clones cellulaires isolés aprés transduction de cellules FRhK-4 par 
les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. 5 wl de surnageant dilués au 1/2 dans 
du tampon de dépét selon Laemmli ont été analysés par western blot révélé par un anticorps monoclonal anti-FLAG 
(M2, Sigma) et un conjugué anti-lgG(H+L) de souris couplé a la peroxidase. T- : surnageant de la lignée FRhK-4 
parentale. T+ : surnageant de cellules BHK infectées par un virus recombinant de la vaccine exprimant le polypeptide 
Ssol. La fléche pleine indique le polypeptide Ssol, tandis que la fleche creuse indique une réaction croisée avec 
une protéine d'origine cellulaire. 

la figure 27 montre les résultats relatifs a l’analyse du polypeptide Ssol purifié 


A. 8, 2, 0.5 et 0.125 wg de polypeptide recombinant Ssol purifié par chromatographie d’affinité anti-FLAG et 
gel filtration (G75) ont été séparés sur gel SDS a 8% de polyacrylamide. Le polypeptide Ssol ainsi que des 
quantités variables de marqueurs de masse moléculaire (MM) ont été révélés par coloration au nitrate d’argent 
(Gelcode SilverSNAP stain kit II, Pierce). 

B. Marqueurs étalons pour l’analyse par spectrométrie de masse SELDI-TOF 


IgG : IgG bovine de MM 147300 
ConA : conalbumine de MM 77490 
HRP : péroxidase de raifort analysée a titre de contrdle et de MM 43240 
C. Analyse par spectrométrie de masse (SELDI-TOF) du polypeptide recombinant Ssol. 


Les pics A et B correspondent au polypeptide Ssol simplement et doublement chargé. 


D. Séquengage de |l’extrémité N-terminale du polypeptide recombinant Ssol. 5 cycles de dégradation d’Edman 
en phase liquide ont été réalisés sur un sequenceur ABI494 (Applied Biosystems). 


la figure 28 illustre l’influence d’un signal d’épissage et des sequences CTE et WPRE sur’efficacité de immunisation 
génique a l'aide d’ADN plasmidique codant la S du SRAS-CoV 
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A.Des groupes de 7 souris BALB/c ont été immunisés a deux reprises a 4 semaines d’intervalle a l'aide de 50 
ug d’ADN plasmidique de pCl, pcDNA-S, pCI-S, pcDNA-N et pCI-HA. 

B. Des groupes de 6 souris BALB/c ont été immunisés a deux reprises a 4 semaines d’intervalle a l’aide de 2 
wg, 10g ou 50 pg d’ADN plasmidique de pCl, pCl-S, pCI-S-CTE et pCl-S-WPRE. 


Les sérums immuns prélevés 3 semaines aprés la deuxiéme immunisation ont été analysés par ELISA indirect en 
utilisant un lysat de cellules VeroE6 infectées par le SRAS-CoV comme antigéne. Les titres en anticorps anti-SRAS- 
CoV sont calculés comme l’inverse de la dilution produisant une DO spécifique de 0,5 aprés révélation par un 
anticorps polyclonal anti-IgG de souris couplé a la peroxidase (NA931V, Amersham) et du TMB (KPL). 

la figure 29 montre la séroneutralisation de linfectivité du SRAS-CoV par les anticorps induits chez la souris aprés 
immunisation génique a |’aide d’ADN plasmidique codantla S du SRAS-CoV. Des pools de sérums immuns prélevés 
3 semaines aprés la deuxiéme immunisation ont été réalisés pour chacun des groupes des expériences décrites 
dans la figure 28 et évalués pour leur capacité a séroneutraliser l’infectivité de 100 TCID50 du SRAS-CoV sur 
cellules FRhK-4. 4 points sont réalisés pour chacune des dilutions de raison 2 testées a partir du 1/20. Le titre 
séroneutralisant est calculé selon la méthode de Reed et Munsch comme I'inverse de la dilution neutralisant l’in- 
fectivité de 2 cupules sur 4. 


A. Groupes de souris BALB/c immunisés a deux reprises a 4 semaines d’intervalle a l’aide de 50 wg d’ADN 
plasmidique de pCl, pcDNA-S, pCI-S, pcDNA-N et pCI-HA. C1: sérum préimmun. Mf: sérum immun. 

B. Groupes de souris BALB/c immunisés a deux reprises a 4 semaines d’intervalle a l’aide de 2 jg, 104g ou 
50 wg d’ADN plasmidique de pCl, pCl-S, pCI-S-CTE et pCl-S-WPRE. 














la figure 30 illustre l’immunoréactivité du polypeptide recombinant Ssol vis a vis de sérums de patients atteints de 
SRAS. La réactivité de sérums de patients a été analysée par test ELISA indirect contre des phases solides préparées 
a l'aide du polypeptide recombinant Ssol purifié. Les anticorps de patients reagissant avec la phase solide a une 
dilution de 1/400 sont révélés par un anticorps polyclonal anti-lgG(H+L) humain couplé a la peroxidase (Amersham 
NA933V) et du TMB plus H202 (KPL). Les sérums de cas probables de SRAS sont identifiés par un numéro d’ordre 
du Centre National de Référence des Virus Influenzae ainsi que par les initiales du patient et le nombre de jours 
écoulés depuis le début des sympt6mes, le cas échéant. Les sérums TV sont des sérums témoins de sujets qui 
ont été prélevés en France avant l’épidémie de SRAS survenue en 2003. 

La figure 31 montre l'induction d’anticorps dirigés contre le SRAS-CoV aprés immunisation avec le polypeptide 
recombinant Ssol. Deux groupe de 6 souris ont été immunisés a 3 semaines d’intervalle avec 10 jg de polypeptide 
recombinant Ssol (groupe Ssol) adjuvé avec de I’hydroxyde d’aluminium ou, a titre de contrdle, de l’adjuvant seul 
(groupe mock). Trois immunisations successives ont été réalisées et les sérums immuns ont été prélevés 3 semaines 
aprés chacune des trois immunisations (IS1, 1S2, |S3). Les sérums immuns ont été analysés par pool pour chacun 
des 2 groupes par ELISA indirect en utilisant un lysat de cellules VeroE6 infectées par le SRAS-CoV comme 
antigéne. Les titres en anticorps anti-SRAS-CoV sont calculés comme l’inverse de la dilution produisant une DO 
spécifique de 0,5 aprés révélation par un anticorps polyclonal anti-lgG de souris couplé a la peroxidase (Amersham) 
et du TMB (KPL). 

La figure 32 présente |’alignement nucléotidique des séquences du géne synthétique 040530 avec la séquence du 
géne sauvage de l’isolat 031589 du SRAS-CoV. I-3059 correspond aux nucléotides 21406-25348 de l’'isolat 031589 
du SRAS-CoV déposé a la C.N.C.M. sous le numéro I-3059 (SEQ ID NO: 4, plasmide pSRAS-S). S-040530 est la 
séquence du géne synthétique 040530. 

la figure 33 illustre l'utilisation d’un géne synthétique pour l’expression de la S du SRAS-CoV. Des extraits cellulaires 
préparés 48 heures aprés transfection de cellulesVeroE6 (A) ou 293T (B) par les plasmides pCl, pCI-S, pCl-S-CTE, 
pCl-S-WPRE et pCl-Ssynth ont été séparés sur un gel SDS a 8% d’acrylamide et analysés par western blot a l'aide 
d'un anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) de lapin couplé a la peroxidase 
(NA934V, Amersham). Le western blot est révélé par luminescence (ECL+, Amersham) et acquisition sur un dispositif 
d'imagerie numérique (FluorS, BioRad). Les niveaux d’expression de la protéine S ont été mesurés en quantifiant 
les 2 bandes majoritaires repérées sur l'image. 

la figure 34 présente un schéma de la construction des virus vaccine recombinants VV-TG-S, VV-TG-Ssol, VV-TN- 
S et VV-TN-Ssol 


A. Les cDNA de la protéine S et du polypeptide Ssol du SRAS-CovV ont été inséré entre les sites BamH1 et 
Sma‘ du plasmide de transfert pTG186 pour obtenir les plasmides pTG-S et pTG-Ssol. 

B. Les sé€quences du promoteur synthétique 480 ont ensuite été substituées a celles du promoteur 7.5 par 
échange du fragment Nde1-Pst1 des plasmides pTG186poly, pTG-S et pTG-Ssol pour obtenir les plasmides 
de transfert pTN480, pTN-S et pTN -Ssol. 
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C. Séquence du promoteur synthétique 480 tel que contenu entre les sites Nde1 et Pst1 des plasmides de 
transfert de la série pTN. Un site Asc1 a été inséré pour faciliter les manipulations ultérieures. Les sites de 
restriction ainsi que la séquence du promoteur sont soulignés 

D. Les virus recombinants de la vaccine sont obtenus par double recombinaison homologue in vivo entre la 
cassette TK des plasmides de transfert des séries pTG et pTN et le géne TK de la souche Copenhague du 
virus de la vaccine. 


SP : peptide signal prédit (aa 1-13) avec le logiciel signalP v2.0 (Nielsen et al., 1997, Protein Engineering, 
10 : 1-6) 

TM : région transmembranaire prédite (aa 1196-1218) avec le logiciel TMHMM v2.0 (Sonnhammer et al., 
1998, Proc. of Sixth Int. Conf. on Intelligent Systems for Molecular Biology, p 175-182, AAAI Press). Il faut 
noter que les acides aminés W1194 et P1195 font possiblement partie de la région transmembranaire avec 
des probabilités respectives de 0,13 et 0,42. 

TK-L, TK-R : parties gauche et droite du géne de la thymidine kinase du virus de la vaccine 

MCS : site multiple de clonage 

PE : promoteur précoce 

PL : promoteur tardif 

PL synth : promoteur tardif synthétique 480 


la figure 35 illustre l’expression de la protéine S par les virus vaccine recombinants, analysée par western blot. Des 
extraits cellulaires ont été préparés 18 heures aprés infection de cellules CV1 par les virus vaccine recombinants 
VV-TG, VV-TG-S et VV-TN-S a une M.O.I. de 2 (A). A titre de contréle, des extraits de cellules VeroE6 ont été 
préparés 8 heures aprés infection par le SRAS-CoV a une multiplicité d’infection de 2. Des extraits cellulaires ont 
également été préparés 18 heures aprés infection de cellules CV1 par les virus vaccine recombinants VV-TG-S, 
VV-TG-Ssol, VV-TN, VV-TN-S et VV-TN-Ssol (B). Ils ont été séparés sur des gels SDS a 8% d’acrylamide et 
analysés par western blot al’aide d’un anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) 
de lapin couplé a la peroxidase (NA934V, Amersham). « 1pl » et « 10pl » indique les quantités d’extraits cellulaires 
déposées sur le gel. Une échelle de masse moléculaire (kDa) est portée sur la figure. 


SRAS-CoV : extrait de cellules VeroE6 infectées par le SRAS-CoV 
Mock : extrait contréle de cellules non infectées 


la figure 36 montre le résultat d’une analyse par western blot de la sécrétion du polypeptide Ssol par les virus vaccine 
recombinants. 


A. Des surnageants de cellules CV1 infectées par le virus vaccine recombinant VV-TN, différents clones du 
virus VV-TN-Ssol et par les virus VV-TG-Ssol ou VV-TN-Sflag ont été récoltés 18 heures aprés infection de 
cellules CV1 a une M.O.I. de 2. 


B. Des surnageants de cellules 293T, FRhK-4, BHK-21 et CV1 infectées en dupliqués (1,2) par le virus vaccine 
recombinant VV-TN-Ssol a une M .O.I. de 2 ont été récoltés 18 heures aprés infection. Le surnageant de cellules 
CV1 infectées par le virus VV-TN a également été récolté a titre de contrdle (M). 


Tous les surnageants ont été séparés sur un gel SDS a 8% d’acrylamide selon Laemmli et analysés par western 
blot a l’aide d’un anticorps monoclonal de souris anti-FLAG et d’un anticorps polyclonal anti-lgG(H+L) de souris 
couplé a la peroxidase (NA931V, Amersham) (A) ou al’aide d’un anticorps polyclonal de lapin anti-S et d’un anticorps 
polyclonal anti-lgG(H+L) de lapin couplé a la peroxidase (NA934V, Amersham) (B). 

Une échelle de masse moléculaire (kDa) est portée sur la figure. 

la figure 37 montre l’analyse du polypeptide Ssol, purifié par gel SDS de polyacrylamide 

10, 5 et 2 wl de polypeptide recombinant Ssol purifié par chromatographie d’affinité anti-FLAG ont été séparés sur 
gel SDS en gradient de 4 a 15 % de polyacrylamide. Le polypeptide Ssol ainsi que des quantités variables de 
marqueurs de masse moléculaire (MM) ont été révélés par coloration au nitrate d’argent (Gelcode SilverSNAP stain 
kit Il, Pierce). 

la figure 38 illustre l’immunoréactivité du polypeptide recombinant Ssol produit par le virus vaccine recombinant VV- 
TN-Ssol vis-a-vis de sérums de patients atteints de SRAS. La réactivité de sérums de patients a été analysée par 
test ELISA indirect contre des phases solides préparées a l’aide du polypeptide recombinant Ssol purifié. Les 
anticorps de patients réagissant avec la phase solide a une dilution de 1/100 et 1/400 sont révélés par un anticorps 
polyclonal anti-lgG(H+L) humain couplé a la peroxidase (Amersham NA933V) et du TMB plus H202 (KPL). Les 
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sérums de cas probables de SRAS sont identifiés par un numéro d’ordre du Centre National de Référence des 
Virus Influenzae ainsi que par les initiales du patient et le nombre de jours écoulés depuis le début des symptémes, 
le cas échéant. Les sérums TV sont des sérums témoins de sujets qui ont été prélevés en France avant l’épidémie 
de SRAS survenue en 2003. 

la figure 39 montre la réponse en anticorps anti-SRAS-CovV chez la souris aprés immunisation par les virus vaccine 
recombinants. Des groupes de 7 souris BALB/c ont été immunisés par voie i.v. a deux reprises a 4 semaines 
d'intervalle par 106 u.f.p. de virus vaccine recombinants VV-TG, VV-TG-HA, VV-TG-S, VV-TG-Ssol, VV-TN, VV- 
TN-S, VV-TN-Ssol. 


A. Des pools de sérums immuns prélevés 3 semaines aprés chacune des deux immunisations ont été réalisés 
pour chacun des groupes et ont été analysés par ELISA indirect en utilisant un lysat de cellules VeroE6 infectées 
par le SRAS-CoV comme antigéne. Les titres en anticorps anti-SRAS-CoV sont calculés comme l’inverse de 
la dilution produisant une DO spécifique de 0,5 aprés révélation par un anticorps polyclonal anti-IgG de souris 
couplé a la peroxidase (NA931V, Amersham) et du TMB (KPL). 

B. Les pools de sérums immuns ont été évalués pour leur capacité a séroneutraliser l’infectivité de 100 TCID50 
du SRAS-CoV sur cellules FRhK-4. 4 points sont réalisés pour chacune des dilutions de raison 2 testées a 
partir du 1/20. Le titre séroneutralisant est calculé selon la méthode de Reed et Munsch comme l’inverse de la 
dilution neutralisant l’infectivité de 2 cupules sur 4. 


la figure 40 décrit la construction des virus recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol. 


A. Le vecteur rougeole est un génome complet de la souche vaccinale Schwarz du virus de la rougeole (MV) 
dans lequel une unité de transcription supplémentaire a été introduite (Combredet, 2003, Journal of Virology, 
77 : 11546-11554). L’expression des phases ouvertes de lecture (ORF) supplémentaires est contrélée par les 
éléments agissant en cis nécessaires a la transcription, a la formation de la coiffe et a la polyadénylation du 
transgéne, qui ont été copiés des éléments présents a la jonction N/P. 2 vecteurs différents permettentl’insertion 
entre les génes P (phosphoprotéine) et M (matrice) d’une part et H (hémagglutinine) et L (polymérase) d’autre 
part. 

B. Les génomes recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol du virus de la rougeole ont été 
construits par l’insertion des ORFs de la protéine S et du polypeptide Ssol au sein d’une unité de transcription 
supplémentaire localisée entre les génes P et M du vecteur. 


Les différents génes du virus de la rougeole (MV) sont indiqués : N (nucléoprotéine), PVC (phosphoprotéine 
et protéine V/C), M (matrice), F (fusion), H (hémagglutinine), L (polymérase). T7 = promoteur de ARN 
polymérase T7, hh = ribozyme hammerhead, T7t = séquence terminatrice de ARN polymérase du phage 
T7, 0 = ribozyme du virus de I'hépatite 0, (2), (3) = unités de transcription supplémentaires (ATU). 

Taille du genome du MV : 15894 nt. 

SP : peptide signal 

TM : région transmembranaire 

FLAG : étiquette FLAG 


la figure 41 illustre l'expression de la protéine S par les virus rougeole recombinants, analysée par western blot. 


Des extraits cytoplasmiques ont été préparés aprés infection de cellules Vero par différents passages des virus 
MVSchw2-SARS-S et MVSchw2-SARS-Ssol et le virus sauvage MWSchw a titre de contrdéle. Des extraits 
cellulaires en tampon de dépét selon Laemmli ont également été préparés 8 heures aprés infection de cellules 
VeroE6 par le SRAS-CoV a une multiplicité d’infection de 3. Ils ont été séparés sur un gel SDS a 8% d’acrylamide 
et analysés par western blot a l’aide d’un anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti- 
IgG(H+L) de lapin couplé a la peroxidase (NA934V, Amersham). 

Une échelle de masse moléculaire (kDa) est portée sur la figure. 

Pn : niéme passage du virus aprés coculture de cellules 293-3-46 et Vero. 

SRAS-CoV : extrait de cellules VeroE6 infectées par le SRAS-CoV 

Mock : extrait contrdle de cellules VeroE6 non infectées 


la figure 42 montre l’expression de la protéine S par les virus rougeole recombinants, analysée par immunofluores- 
cence 

Des cellules Vero en monocouches sur lamelles de verre ont été infectées par le virus sauvage MWSchw (A) ou 
les virus MVSchw2-SARS-S (B) et MVSchw2-SARS-Ssol (C). Quand les syncytia ont atteint 30 a 40% de confluence 
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(A., B.) ou 90-100% (C), les cellules ont été fixées, perméabilisées et marquées par des anticorps polyclonaux de 
lapins anti-SRAS-CoV et un conjugué anti-lgG(H+L) de lapin couplé au FITC (Jackson). 

- — la figure 43 illustre l'analyse par western blot de l’immunoréactivité de sérums de lapins dirigés contre les peptides 
E1-12, E53-76 et M2-14. Le lapin 20047 a été immunisé avec le peptide E1-12 couplé a la KLH. Les lapins 22234 
et 22240 ont été immunisés avec le peptide E53-76 couplé a la KLH. Les lapins 20013 et 20080 ont été immunisés 
avec le peptide M2-14 couplé a la KLH. Les immunsérums ont été analysés par western blot a l’aide d’extraits de 
cellules infectées par le SRAS-CoV (B) ou a l'aide d’extraits de cellules infectées par un virus recombinant de la 
vaccine exprimant la protéine E (A) ou M (C) de l’isolat 031589 du SRAS-CoV. Les immunoempreintes ont été 
révélées a l'aide d’un conjugué anti-lgG(H+L) de lapin couplé a la peroxidase (NA934V, Amersham). 


[0148] La position des protéines E etM est indiquée par une fléche. 

[0149] Une échelle de masse moléculaire (kDa) est portée sur la figure. 

[0150] II doit étre bien entendu, toutefois, que ces exemples sont donnés uniquement a titre d’illustration de l’objet de 
linvention, dont ils ne constituent en aucune maniére une limitation. 


Exemple 1 : Clonage et sequengage du génome de la souche de SARS-CoV issue du prélevement répertorié 
sous le numéro 031589 


[0151] L’ARN dela souche de SARS-CoV a été extrait a partir du prélevement de lavage bronchoalvéolaire répertorié 
sous le numéro 031589, effectué sur un patient de I’hdpital francais de Hanoi (Vietnam) atteint de SRAS. 

[0152] L’ARN isolé a été utilisé comme matrice pour amplifier les ADNc correspondant aux différents cadres ouverts 
de lecture du génome (ORF la, ORF 1b, ORF-S, ORF-E, ORF-M, ORF-N (incluant les ORF-13 et ORF-14), ORF3, ORF4, 
ORF7 a ORF 11), et aux extrémités 5’ et 3’ non-codantes. Les séquences des amorces et des sondes utilisées pour 
l'amplification/détection ont été définies d’aprés la séquence nucléotidique disponible du SARS-CoV. 

[0153] Dans ce qui suit les amorces et les sondes sont identifiées par : la lettre S, suivie d’une lettre qui indique la 
région correspondante du génome (L pour l’extrémité 5’incluant ORF1a et ORF 1b ; S, M et N pour les ORF-S, ORF-M, 
ORF-N, SE et MN pour les régions intergéniques correspondantes), puis éventuellement de Fn, Rn, avec n inclus entre 
1 et 6 correspondant aux amorces utilisées pour la PCR nichée ou imbriquée (paire F1 +R1 pour la premiére amplification, 
paire F2 + R2 pour la deuxiéme amplification, etc...), puis de /+/ ou /-/ correspondant a une amorce sens ou antisens 
et enfin des positions des amorces en référence a la sequence Genbank AY27411.3 ; pour les amorces S et N sens et 
antisens et les autres amorces sens uniquement, lorsqu’une seule position est indiquée elle correspond a celle de 
l’extrémité 5’ d’une sonde ou d’une amorce d’environ 20 bases ; pour les amorces antisens autres que les amorces S 
et N, lorsqu’une seule position est indiquée elle correspond a celle de l’extrémité 3’ d’une sonde ou d’une amorce 
d’environ 20 bases. 

[0154] Les produits d’amplifications ainsi générés ont été sequencés a l’aide d’amorces spécifiques afin de déterminer 
la sequence compléte du génome de la souche de SARS-CoV issue du prélévement répertorié sous le numéro 031589. 
Ces produits d’amplification, a l'exception de ceux correspondant aux ORF 1a et ORF 1b, ont ensuite été clonés dans 
des vecteurs d’expression afin de produire les protéines virales correspondantes et les anticorps dirigés contre ces 
protéines, notamment par immunisation a base d’ADN. 


1. Extraction des ARN 


[0155] Les ARN ont été extraits a l'aide du kit Qlamp viral RNA extraction mini (QIAGEN) en suivant les recomman- 
dations du fabricant. De maniére plus précise : 140 wl du prélevement et 560 wl de tampon AVL ont été mélangés 
vigoureusement pendant 15 secondes, incubés 10 min a température ambiante puis centrifugés briévement a vitesse 
maximale. 560 yl d’éthanol a 100% ont été ajoutés au surnageant et le mélange ainsi obtenu a été agité trés vigoureu- 
sement pendant 15 sec. 630 wl du mélange ont ensuite été déposés sur la colonne. 

[0156] Lacolonne a été placée sur un tube de 2 ml, centrifugée 1 min a 8000 rpm, puis le reste du mélange précédent 
a été déposé sur la méme colonne, centrifugé a nouveau, 1 min a 8000 rpm et la colonne a été transférée sur un tube 
de 2 ml propre. Ensuite, 500 wl de tampon AW1 ont été ajoutés sur la colonne, puis la colonne a été centrifugée 1 min 
a 8000 rpm et I’éluat a été éliminé. 500 wl de tampon AW2 ont été ajoutés sur la colonne qui a ensuite été centrifugée 
3 min a 14000 rpm et transférée sur un tube de 1,5 ml. Enfin, 60 wl de tampon AVE ont été ajoutés sur la colonne qui 
a été incubée 1 a 2 min a température ambiante puis centrifugée 1 min a 8000 rpm. L’éluat correspondant a l’ARN purifié 
a été récupéré et congelé a -20°C. 
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2. Amplification, sequengage et clonage des ADNc 





2.1) ADNc codant pour la protéine S 


[0157] Les ARN extraits a partir du prélevement ont été soumis a une transcription inverse a l’aide d’oligonucléotides 
hexamériques de séquence aléatoire (pdN6), afin de produire des fragments d’ADNc. 

[0158] La séquence codant pour la glycoprotéine S du SARS-CoV a été amplifiée sous la forme de deux fragments 
d’ADN chevauchants : fragment 5’ (SRAS-Sa, SEQ ID NO:5) et fragment 3’(SRAS-Sb, SEQ ID NO:6), en réalisant deux 
amplifications successives a l’aide d’amorces imbriquées. Les amplicons ainsi obtenus ont été séquencés, clonés dans 
le vecteur plasmidique PCR 2.1-TOPO™ (IN VITROGEN), puis la séquence des ADNc clonés a été déterminée. 


a)clonage et séquengage des fragments Sa et Sb 





a,) synthese de l'ADNc 


[0159] Le mélange réactionnel contenant : ARN (5 wl) , H2O ppi (3,5 wl), tampon de transcriptase inverse5X (4 ul,), 
dNTP 5 mM (2 wl), pdN6 100 ug/ml (4 wl), RNasin 40 Ul/ul (0,5 wl) et transcriptase inverse AMV-RT, 10 Ul/ul, PROMEGA 
(1pl) a été incubé dans un thermocycleur dans les conditions suivantes : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, 
puis ’ADNc obtenu a été maintenu a +4°C. 


a>) premiére amplification PCR 


[0160] Les extrémités 5’ et 3’ du géne S ont été amplifiées respectivement avec les paires d’amorces S/FI/+/ 
21350-21372 et S/R1/-/ 23518-23498, S/F3/+/ 23258-23277 et S/R3/-/25382-25363. Le mélange réactionnel de 50 wl 
contenant : ADNc (2 wl), amorces 50 pM (0,5 wl), tampon 10 X (5 wl), dNTP 5 mM (2 wl), Taq Expand High Fidelity, 
Roche (0,75 wl) et H20 (39, 75 pl) a été amplifié dans un thermocycleur, dans les conditions suivantes : une étape initiale 
de dénaturation a 94°C pendant 2 min a été suivie de 40 cycles comprenant : une étape de dénaturation a 94°C pendant 
30 sec, une étape d’hybridation a 55°C pendant 30 sec puis une étape d’élongation a 72°C pendant 2 min 30 sec, avec 
10 sec d’élongation supplémentaire a chaque cycle, puis d’une étape finale d’élongation a 72°C pendant 5 min. 


a3) deuxiéme amplification PCR 


[0161] Les produits de la premiére amplification PCR (amplicons 5’ et 3’) ont subi une seconde étape d’amplification 
PCR (PCR nichée) dans des conditions identiques a celles de la premiére amplification, avec les paires d’amorces 
S/F2/+/21406-21426 et S/R2/-/23454-23435, et S/F4/+/23322-23341 et S/R4/-/25348-25329, respectivement pour l’am- 
plicon 5’ et amplicon 3’. 


ay) clonage et séguengage des fragments Sa et Sb 





[0162] Les amplicons Sa (extrémité 5’) et Sb (extrémité 3’) ainsi obtenus ont été purifiés a l'aide du kit Q/Aquick PCR 
purification (QIAGEN), en suivant les recommandations du fabricant, puis ils ont été clonés dans le vecteur PCR2.1- 
TOPO (kit Invitrogen), pour donner les plasmides dénommés SRAS-S1 et SRAS-S2. 

[0163] L’ADN des clones Sa et Sb a été isolé puis l’insert correspondant a été séquencé a l'aide du Kit Big Dye, 
Applied Biosystem® et des amorces universelles M13 forward et M13 reverse, ainsi que des amorces : S/S/+/21867, 
S/S/+/22353, S/S/+/22811, S/S/+/23754, S/S/+/24207, S/S/+/24699, S/S/+/24348, S/S/-/24209, S/S/-/23630, S/S/-/ 
23038, S/S/-/22454, S/S/-/21815, S/S/-/24784, S/S/+/21556, S/S/+/23130 et S/S/+/24465, en suivant les instructions 
du fabricant ; les séquences des fragments Sa et Sb ainsi obtenues correspondent aux séquences SEQ ID NO :5 et 
SEQ ID NO °:6 dans la liste de séquences jointe en annexe. 

[0164] Le plasmide, dénommé SARS-S1 a été déposé sous le n° I-3020, le 12 mai 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un fragment 5’ 
de la séquence du géne S de la souche de SARS-CoV issue du prélévement répertorié sous le n° 031589, telle que 
définie ci-dessus, lequel fragment dénommé Sa correspondant aux nucléotides des positions 21406 a 23454 (SEQ ID 
NO :5), en référence a la sequence Genbank AY274119.3 Tor2. 

[0165] Le plasmide, dénommé TOP10F’-SARS-S2 a été déposé sous le n° |-3019, le 12 mai 2003, auprés de la 
Collection Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient un 
fragment 3’de la sequence du géne S de la souche de SARS-CoV issue du prélévement répertorié sous le n° 031589, 
telle que définie ci-dessus, lequel fragment deénommé Sb correspondant aux nucléotides des positions 23322 a 25348 
(SEQ ID NO: 6), en référence a la séquence Genbank n° d’accés AY274119.3. 
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b) clonage et sequengage de l’'ADNc complet (clone SRAS-S de 4 kb) 





[0166] L’ADNc S complet a été obtenu a partir des clones SARS-S1 et SARS-S2 précités, de la fagon suivante : 


1) une réaction d’amplification PCR a été réalisée sur un clone SARS-S2 en présence de l’amorce S/R4/-/ 
25348-25329 précitée et de l’amorce S/S/+/24696-24715: un amplicon de 633 pb a été obtenu, 

2) une autre réaction d’amplification PCR a été réalisée sur un autre clone SARS-S2, en présence des amorces 
S/F4/+/23322-23341 précitée et S/S/- /24803-24784: un amplicon de 1481 pb a été obtenu, 

La réaction d’amplification a été réalisée dans les conditions telles que définies ci-dessus pour l’amplification des 
fragments Sa et Sb, a l'exception que 30 cycles d’amplifications comprenant une étape de dénaturation a 94° C 
pendant 20 sec et une étape d’élongation a 72° C pendant 2 min 30 sec ont été effectués. 

3) les 2 amplicons (633 pb et 1481 pb) ont été purifiés dans les conditions telles que définies ci-dessus pour les 
fragments Sa et Sb. 

4) une autre réaction d’amplification PCR a l'aide des amorces S/F4/+/23322-23341 et S/R4/-/25348-25329 préci- 
tées, a été réalisée sur les amplicons purifiés obtenus en 3). La réaction d’amplification a été réalisée dans les 
conditions telles que définies ci-dessus pour l’amplification des fragments Sa et Sb, a l'exception que 30 cycles 
d’amplifications ont été effectués. 

L’amplicon de 2026 pb ainsi obtenu a été purifié, cloné dans le vecteur PCR2.1-TOPO puis séquencé comme ci- 
dessus, a l’aide des amorces telles que définies ci-dessus pour les fragments Sa et Sb. Le clone ainsi obtenu a été 
dénommé clone 3’. 

5) Le clone SARS-S1 précédemment obtenu et le clone 3’ont été digérés par EcoR |, les bandes d’environ 2kb ainsi 
obtenues ont été purifiées sur gel puis amplifiges par PCR avec les amorces S/F2/+/21406-21426 et S/R4/-/ 
25348-25329 précitées. La réaction d’amplification a été réalisée dans les conditions telles que définies ci-dessus 
pour l’amplification des fragments Sa et Sb, al’exception que 30 cycles d’amplifications ont été effectués. L’amplicon 
denviron 4 kb a été purifié et séquencé. Il a ensuite été cloné dans le vecteur PCR2.1-TOPO pour donner le 
plasmide, dénommé SARS-S, et l’insert contenu dans ce plasmide a été séquencé comme ci-dessus, a l’aide des 
amorces telles que définies ci-dessus pour les fragments Sa et Sb. Les séquences d’ADNc de l’insert et de l’amplicon 
codant pour la protéine S, correspondent respectivement aux séquences SEQ ID NO: 4 et SEQ ID NO: 2 dans la 
liste de séquences jointe en annexe, elles codent pour la protéine S (SEQ ID NO: 3). 


[0167] La séquence de l’amplicon correspondant a l’ADNc codant pour la protéine S de la souche de SARS-CoV 
issue du prélevement n°031589 présente les deux mutations suivantes par rapport aux séquences correspondantes de 
respectivement les isolats Tor2 et Urbani, les positions des mutations étant indiquées en référence a la séquence 
compléte du génome de l’isolat Tor2 (Genbank AY274119.3) : 


- g/t en position 23220 ; le codon alanine (gct) en position 577 de la sequence en acides aminés de la protéine S de 
Tor2 est remplacé par un codon sérine (tct), 
- c/ten position 24872 : cette mutation ne modifie pas la sequence en acides aminés de la protéine S, et 


[0168] Le plasmide, dénommé SARS-S, a été déposé sous le n° I-3059, le 20 juin 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il contient la sequence 
d’ADNc codant pour la protéine S de la souche de SARS-CoV issue du prélévement répertorié sous le n° 031589, 
laquelle séquence correspondant aux nucléotides des positions 21406 a 25348 (SEQ ID NO :4), en référence a la 
séquence Genbank AY274119.3. 


2.2) ADNc codant pour les protéines M et E 


[0169] Les ARN issus du prélévement 031589, extraits comme ci-dessus, ont été soumis a une transcription inverse, 
associée, lors de la méme étape (kit Titan One Step RT-PCR®, Roche), a une réaction d’amplification par PCR, a l’aide 
des couples d’amorces : 


-  S/E/F1/+/26051-26070 et S/E/RI/-/26455-26436 pour amplifier l'ORF-E, et 
-  S/M/F1/+/26225-26244 et S/M/RI/-/27148-27129 pour amplifier l’ORF-M. 


[0170] Un premier mélange réactionnel contenant : 8,6 wl d’H2Oppi, 1 wl de dNTP (5mM), 0,2 wl de chacune des 
amorces (50M), 1,25 wl de DTT (100mM) et 0,25 pl de RNAsin (40UI/ul) a été combiné avec un deuxiéme mélange 
réactionnel contenant : 1 wl d’ARN, 7 pl d’H2Oppi, 5 wl de tampon de RT-PCR 5X et 0,5 wl de mélange d’enzyme et les 
mélanges combinés ont été incubés dans un thermocycleur dans les conditions suivantes : 30 min a 42°C, 10 mina 
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55°C, 2 min a 94°C suivi de 40 cycles comprenant une étape de dénaturation a 94°C pendant 10 sec, une étape 
d’hybridation a 55°C pendant 30 sec et une étape d’élongation a 68°C pendant 45 sec, avec 3 sec d’incrément par cycle 
et enfin une étape d’élongation terminale a 68°C pendant 7 min. 

[0171] Les produits d’amplification ainsi obtenus (amplicons M et E) ont subi une deuxiéme amplification PCR (PCR 
nichée) en utilisant le kit Expand High-Fi®, Roche), a l’aide des couples d’amorces : 


- — S/E/F2/+/26082-26101 et S/E/R2/-/26413-26394 pour l’amplicon E, et 
- S/M/F2/+/26330-26350 et S/M/R2/-/27098-27078 pour l’'amplicon M. 


[0172] Le mélange réactionnel contenant : 2 wl du produit de la premiére PCR, 39,25 wl d’H2Oppi, 5 wl de tampon 
10X contenant du MgCl., 2 | de dNTP (5mM), 0,51 de chacune des amorces (50 M) et 0,751 de mélange d’enzyme 
a été incubé dans un thermocycleur dans les conditions suivantes : une étape de dénaturation a 94°C pendant 2 mina 
été suivie de 30 cycles comprenant une étape de dénaturation a 94°C pendant 15 sec, une étape d’hybridation a 60°C 
pendant 30 sec et une étape d’élongation a 72°C pendant 45 sec, avec 3 sec d’incrément par cycle, et enfin une étape 
d’élongation terminale a 72°C pendant 7 min. Les produits d’amplification obtenus correspondant aux ADNc codant 
pour les protéines E et M ont été séquencés comme ci-dessus, a l'aide des amorces : S/E/F2/+/26082 et S/E/R2/-/ 
26394, S/M/F2/+/26330, S/M/R2/-/27078 précitées et des amorces S/M/+/26636-26655 et S/M/-/26567-26548. Ils ont 
ensuite été clonés, comme ci-dessus, pour donner les plasmides dénommés SARS-E et SARS-M. L’ADN de ces clones 
a ensuite été isolé et sequencé a l’aide des amorces universelles M13 forward et M13 reverse ainsi que des amorces 
S/M/+/26636 et S/M/-/26548 précitées. 

[0173] La séquence de l’amplicon représentant l’ADNc codant pour la protéine E (SEQ ID NO: 13) de la souche de 
SARS-CoV issue du prélévement n°031589 ne comporte pas de différences par rapport aux séquences correspondantes 
des isolats AY274119.3-Tor2 et AY278741-Urbani. La séquence de la protéine E de la souche de SARS-CoV 031589 
correspond a la séquence SEQ ID NO: 14 dans la liste de séquences jointe en annexe. 

[0174] Le plasmide, dénommé SARS-E a été déposé sous le n° |-3046, le 28 mai 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence 
d’ADNc codant pour la protéine E de la souche de SARS-CoV issue du prélévement répertorié sous le n° 031589, telle 
que définie ci-dessus, laquelle séquence correspondant aux nucléotides des positions 26082 a 26413 (SEQ ID NO: 
15), en référence a la sequence Genbank n° d’accés AY274119.3. 

[0175] La séquence de l’amplicon représentant l’ADNc codant pour la M (SEQ ID NO :16) de la souche de SARS- 
CoV issue du prélévement n°031589 ne comporte pas de différences par rapport a la séquence correspondante de 
l'isolat AY274119.3-Tor2. En revanche, en position 26857, l’isolat AY278741-Urbani comporte un c et la sequence de 
la souche de SARS-CoV issue du prélévement répertorié sous le n°031589 un t. Cette mutation aboutit a une modification 
de la séquence en acides aminés de la protéine correspondante: en position 154, une proline (AY278741-Urbani) est 
changée en sérine dans la souche de SARS-CoV issue du prélevement répertorié sous le n°031589. La sequence de 
la protéine M de la souche de SARS-CoV issue du prélévement répertorié sous le n°031589 correspond a la séquence 
SEQ ID NO :17 dans la liste de séquences jointe en annexe. 

[0176] Le plasmide, dénommé SARS-M a été déposé sous le n° |-3047, le 28 mai 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence 
d’ADNc codant pour la protéine M de la souche de SARS-CoV issue du prélévement répertorié sous le n° 031589, telle 
que définie ci-dessus ; laquelle séquence correspondant aux nucléotides des positions 26330 a 27098 (SEQ ID NO: 
18), en référence a la sequence Genbank n° d’accés AY274119.3. 


2.3) ADNc correspondant aux ORF3, ORF4, ORF7 a ORF11 
[0177] La méme stratégie d’amplification, de clonage et de séquencage a été utilisée pour obtenir les fragments 
d’ADNc correspondant respectivement aux ORF suivantes: ORF 3, ORF4, ORF7, ORF8, ORF9, ORF 10 et ORF 11. Les 


couples d’amorces utilisées pour la premiére amplification sont : 


- ORF3 et ORF4: S/SE/F1/+/25069-25088 et S/SE/R1/-/26300-26281 
- ORF7 a ORF 11 : S/MN/F1/+/26898-26917 et S/MN/R1/-/28287-28266 


[0178] Les couples d’amorces utilisées pour la deuxiéme amplification sont : 


-  ORF3 et ORF4: S/SE/F2/+/25110-25129 et S/SE/R2/-/26244-26225 
- ORF7 a ORF 11 : S/MN/F2/+/26977-26996 et S/MN/R2/-/28218-28199 


[0179] Les conditions de la premiére amplification (RT-PCR) sont les suivantes : 45 min a 42°C, 10 min a 55°C, 2 
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min a 94°C suivi de 40 cycles comprenant une étape de dénaturation a 94°C pendant 15 sec, une étape d’hybridation 
a 58°C pendant 30 sec et une étape d’élongation a 68°C pendant 1 min, avec 5 sec d’incrément par cycle et enfin une 
étape d’élongation terminale a 68°C pendant 7 min. 

Les conditions de la PCR nichée sont les suivantes : une étape de dénaturation a 94°C pendant 2 min a été suivie de 
40 cycles comprenant une étape de dénaturation a 94°C pendant 20 sec, une étape d’hybridation a 58°C pendant 30 
sec et une étape d’élongation a 72°C pendant 50 sec, avec 4 sec d’incrément par cycle et enfin une étape d’élongation 
terminale a 72°C pendant 7 min. 

[0180] Les produits d’amplification obtenus correspondant aux ADNc contenant respectivement les ORF3 et 4 et les 
ORF7 a 11 ont été séquencés a l’aide des amorces : S/SE/+/25363, S/SE/+/25835, S/SE/-/25494, S/SE/-/25875, S/MN/ 
+/27839, S/MN/+/27409, S/MN/-/27836 S/MN/-/27799 et clonés comme ci-dessus pour les autres ORF, pour donner 
les plasmides dénommés SARS-SE et SARS-MN. L’ADN de ces clones a été isolé et sequencé a l'aide de ces mémes 
amorces et des amorces universelles M13 sens et M13 anti-sens. 

[0181] La séquence de l’amplicon représentant I’ ADNc de la région contenant les ORF 3 et 4 (SEQ ID NO :7) de la 
souche de SARS-CoV issue du prélévement n°031589 comporte une différence nucléotidique par rapport a la sequence 
correspondante de l’isolat AY274119-Tor2. Cette mutation en position 25298 aboutit a une modification de la séquence 
en acides aminés de la protéine correspondante (ORF 3): en position 11, une arginine (AY274119-Tor2) est changée 
en glycine dans la souche de SARS-CoV issue du prélévement n°031589. En revanche, aucune mutation n’a été 
identifiée par rapport a la séquence correspondante de l’isolat AY278741-Urbani. Les sequences des ORF 3 et 4 la 
souche de SARS-CoV issue du prélévement n°031589 correspondent respectivement aux séquences SEQ ID NO :10 
et 12 dans la liste de séquences jointe en annexe. 

[0182] Leplasmide, dénommé SARS-SE a été déposé sous le n° |-3126, le 13 novembre 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient ! ADNc corres- 
pondant a la région située entre lORF-S et ’ORF-E et chevauchant lORF-E de la souche de SARS-CoV issue du 
prélévement répertorié sous le n° 031589, telle que définie ci-dessus, laquelle région correspondant aux nucléotides 
des positions 25110 a 26244 (SEQ ID NO :8), en référence a la sequence Genbank n° d’accés AY274119.3, 

[0183] _Laséquence de l’amplicon représentant l’ADNc correspondant a la région contenant les ORF7 a ORF11 (SEQ 
ID NO :19) de la souche de SARS-CoV issue du prélevement n°031589 ne comporte pas de différences par rapport 
aux séquences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les sequences des ORF7 a 11 de 
la souche de SARS-CoV issue du prélévement n°031589 correspondent respectivement aux séquences SEQ ID NO: 
22, 24, 26, 28 et 30 dans la liste de séquences jointe en annexe. 

[0184] Leplasmide dénommé SARS-MN a été déposé sous le n° |-3125, le 13 novembre 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient la sequence 
d’ADNc correspondant a la région située entre lORF-M et l‘ORF-N de la souche de SARS-CoV issue du prélevement 
répertorié sous le n° 031589 et prélevée a Hanoi, telle que définie ci-dessus, laquelle sequence correspondant aux 
nucléotides des positions 26977 a 28218 (SEQID NO :20 ), enréférence ala sequence Genbank n° d’accés AY274119.3. 
[0185] Laséquence de l’amplicon représentant l’ADNc correspondant a la région contenant les ORF7 a ORF11 (SEQ 
ID NO :19) de la souche de SARS-CoV issue du prélevement n°031589 ne comporte pas de différences par rapport 
aux séquences correspondantes des isolats AY274119-Tor2 et AY278741-Urbani. Les sequences des ORF7 a 11 de 
la souche de SARS-CoV issue du prélévement n°031589 correspondent respectivement aux séquences SEQ ID NO: 
22, 24, 26, 28 et 30 dans la liste de séquences jointe en annexe. 


2.4) ADNc codant pour la protéine N et incluant les ORF13 et ORF14 


[0186] L’ADNc a été synthétisé et amplifi€é comme décrit ci-dessus pour les fragments Sa et Sb. De maniére plus 
précise, le mélange réactionnel contenant : 5 wl d’ARN, 5 pl d’H2O ppi 4 wl de tampon de reverse transcriptase 5X, 2 
pl de dNTP (5 mM), 2 wl d’oligo 20T (5 1M), 0,5 wl de RNasin (40 Ul/ul) et 1, 5 wl de AMV-RT (10 Ul/ul Promega) a été 
incubé dans un thermocycleur dans les conditions suivantes : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, puis il a été 
maintenu a +4°C. 

[0187] Une premiére amplification PCR a été réalisée avec la paire d’amorces S/N/F3/+/28023 et S/N/R3/-/29480. 
[0188] Le mélange réactionnel comme ci-dessus pour l’amplification des fragments S1 et S2 a été incubé dans un 
thermocycleur, dans les conditions suivantes : une étape initiale de dénaturation a 94°C pendant 2 min a été suivie de 
40 cycles comprenant une étape de dénaturation a 94°C pendant 20 sec, une étape d’hybridation a 55°C pendant 30 
sec puis une étape d’élongation a 72°C pendant 1 min 30 sec avec 10 sec d’élongation supplémentaire a chaque cycle, 
puis d’une étape finale d’élongation a 72°C pendant 5 min. 

[0189] L’amplicon obtenu a la premiére amplification PCR a subi une seconde étape d’amplification PCR (PCR nichée) 
avec la paires d’amorce S/N/F4/+/28054 et S/N/R4/-/29430 dans des conditions identiques a celles de la premiére 
amplification. 

[0190] Le produit d’amplification obtenu correspondant a |'ADNc codant pour la protéine N de la souche de SARS- 
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CoV issue du prélevement n°031589a été séquencé a l’aide des amorces: S/N/F4/+/28054, S/N/R4/-/29430, S/N/+/ 
28468, S/N/+/28918 et S/N/-/28607 et cloné comme ci-dessus pour les autres ORF, pour donner le plasmide dénommé 
SARS-N. L’ADN de ces clones a été isolé et sequencé a l’aide des amorces universelles M13 sens et M13 anti-sens, 
ainsi que des amorces S/N/+/28468, S/N/+/28918 et S/N/-/28607. 

[0191] La séquence de l’amplicon représentant l'ADNc correspondant a |'ORF-N et incluant les ORF13 et ORF14 
(SEQ ID NO :36) de la souche de SARS-CoV issue du prélevement n°031589 ne comporte pas de différences par 
rapport aux séquences correspondantes des isolats AY274119.3-Tor2 et AY278741-Urbani. La séquence de la protéine 
N de la souche de SARS-CoV issue du prélévement n°031589 correspond a la sequence SEQ ID NO : 37 dans la liste 
de séquences jointe en annexe. 

[0192] Les séquences des ORF 13 et 14 de la souche de SARS-CoV issue du prélévement n°031589 correspondent 
respectivement aux séquences SEQ ID NO: 32 et 34 dans la liste de séquences jointe en annexe. 

[0193] Leplasmide dénommé SARS-N a été déposé sous le n° |-3048, le 5 juin 2003, auprés de la Collection Nationale 
de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15; il contient !ADNc codant pour la 
protéine N de la souche de SARS-CoV issue du prélévement répertorié sous le n° 031589, telle que définie ci-dessus, 
laquelle séquence correspondant aux nucléotides des positions 28054 a 29430 (SEQ ID NO :38), en référence a la 
séquence Genbank n° d’accés AY274119.3. 


2.5) extrémités 5’ et 3’ non-codantes 
a) extrémité 5’non-codante (5’NC) 


a,) synthése de l'ADNc 


[0194] Les ARN issus du prélévement 031589, extraits comme ci-dessus, ont été soumis a une transcription inverse 
dans les conditions suivantes : 

[0195] L’ARN (15 pl) et l’'amorce S/L/-/443 (3 wl a la concentration de 5m, ont été incubés 10 min a 75°C. 

[0196] Ensuite, du Tampon de transcriptase inverse 5X (6 wl, INVITROGEN), des dNTP 10 mM (1 wl), du DTT 0,1M 
(3 pl) ont été ajoutés et le mélange a été incubé a 50°C pendant 3 min. 

[0197] Enfin la transcriptase inverse (3 pl de Superscript®, INVITROGEN) a été ajoutée au mélange précédent qui 
a été incubé a 50°C pendant 1h30 puis a 90 °C pendant 2 min. 

[0198] L’ADNcainsiobtenu a été purifié a l'aide du kit Q/Aquick PCR purification (QIAGEN), selon les recommandations 
du fabricant. 


b,) Réaction a la Terminal Transferase (TdT) 





[0199] L’ADNc (10 wl) est incubé 2 min a 100°C, conserve dans la glace, puis sont ajoutés : H,0 (2,5 wl), tampon TdT 
5X (4 wl, AMERSHAM), dATP 5mM (2 pl) et TdT (1,5 pl, AMERSHAM). Le mélange ainsi obtenu est incubé 45 min a 
37°C puis 2 min a 65°C. 

[0200] Le produit obtenu est amplifié par une premiére réaction PCR a l’aide des amorces : S/L/-/225-206 et ancre 
14T : 5-AGATGAATTCGGTACCTTTTTTTTTTTTTT-3' (SEQ ID NO :68). Les conditions de l’amplification sont les 
suivantes : une étape initiale de dénaturation a 94°C pendant 2 min est suivie de 10 cycles comprenant une étape de 
dénaturation a 94°C pendant 10 sec, une étape d’hybridation a 45°C pendant 30 sec puis une étape d’élongation a 72°C 
pendant 30 sec puis de 30 cycles comprenant une étape de dénaturation a 94°C pendant 10 sec, une étape d’hybridation 
a 50°C pendant 30 sec puis une étape d’élongation a 72°C pendant 30 sec, puis d’une étape finale d’élongation a 72°C 
pendant 5 min. 

[0201] Le produit de la premiére amplification PCR a subi une seconde étape d’amplification a l’aide des amorces : 
S/L/-/204-185 et ancre 14T précitée dans des conditions identiques a celles de la premiére amplification. L’amplicon 
ainsi obtenu a été purifié, sequencé a l’aide de l’amorce S/L/-/182-163 puis il a été cloné comme ci-dessus pour les 
différentes ORF, pour donner le plasmide dénommé SARS-5’NC. L’ADN de ce clone a été isolé et séquencé a l’aide 
des amorces universelles M13 sens et M13 anti-sens et de l’amorce S/L/-/182-163 précitée. 

[0202] L’amplicon représentant l’ADNc correspondant a l’extrémité 5’NC de la souche de SARS-CoV issue du prélé- 
vement répertorié sous le n° 031589 correspond a la sequence SEQ ID NO: 72 dans la liste de séquences jointe en 
annexe ; cette séquence ne comporte pas de differences par rapport aux séquences correspondantes des isolats 
AY274119.3-Tor2 et AY278741-Urbani. 

[0203] Leplasmide dénommé SARS-5’'NC a été déposé sous le n° |- 3124, le 7 novembre 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15 ; il contient l ADNc corres- 
pondant a l’extrémité 5’non codante du génome de la souche de SARS-CoV issue du prélévement répertorié sous le 
n° 031589, telle que définie ci-dessus, laquelle séquence correspondant aux nucléotides des positions 1 a 204 (SEQ 
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ID NO :39 ), en référence a la séquence Genbank n° d’accés AY274119.3. 
b) extrémité 3’non-codante (3’NC) 


a,) synthése de l’'ADNc 


[0204] Les ARN issus du prélévement 031589, extraits comme ci-dessus, ont été soumis a une transcription inverse, 
selon le protocole suivant : le mélange réactionnel contenant : ARN (5 wl), H2O (5 wl), tampon de transcriptase inverse 
5X (4 wl), dNTP 5 mM (2 wl), Oligo 20T 5M (2 wl), RNasin 40 U/ pl (0,5 pl) et RT-AMV 10 UI/ wl (1,5 wl, PROMEGA) 
a été incubé dans un thermocycleur, dans les conditions suivantes : 45 min a 42°C, 15 min a 55°C, 5 min a 95°C, puis 
ila été maintenu a +4°C. 

[0205] L’ADNc obtenu a été amplifié par une premiére réaction PCR a l'aide des amorces S/N/+/28468-28487 et 
ancre 14T précitée. Les conditions de l’amplification sont les suivantes : une étape initiale de dénaturation a 94°C 
pendant 2 min est suivie de 10 cycles comprenant une étape de dénaturation a 94°C pendant 20 sec, une étape 
d’hybridation a 45°C pendant 30 sec puis une étape d’élongation a 72°C pendant 50 sec puis de 30 cycles comprenant 
une étape de dénaturation a 94°C pendant 20 sec, une étape d’hybridation a 50°C pendant 30 sec puis une étape 
d’élongation a 72°C pendant 50 sec, puis d’une étape finale d’élongation a 72°C pendant 5 min. 

[0206] Le produit de la premiére amplification PCR a subi une seconde étape d’amplification a l'aide des amorces 
S/N/+/28933-28952 et ancre 14T précitée, dans des conditions identiques a celles de la premiére amplification. L’am- 
plicon ainsi obtenu a été purifié, sequencé a l’aide de l’amorce S/N/+/29257-29278 et cloné comme ci-dessus pour les 
différentes ORF, pour donner le plasmide dénommé SARS-3’NC. L’ADN de ce clone a été isolé et séquencé a l’aide 
des amorces universelles M13 sens et M13 anti-sens et de l’'amorce S/N/+/29257-29278 précitée. 

[0207] L’amplicon représentant l’ADNc correspondant a l’extrémité 3’NC de la souche de SARS-CoV issue du prélé- 
vement répertorié sous le n° 031589 correspond a la séquence SEQ ID NO :73 dans la liste de séquences jointe en 
annexe ; cette séquence ne comporte pas de differences par rapport aux séquences correspondantes des isolats 
AY274119.3-Tor2 et AY278741-Urbani. 

[0208] Leplasmide dénommé SARS-3’NC a été déposé sous le n° I-3123 le 7 novembre 2003, auprés de la Collection 
Nationale de Cultures de Microorganismes, 25 rue du Docteur Roux, 75724 Paris Cedex 15. ; il contient la sequence 
d’ADNc correspondant a |l’extrémité 3’non codante du génome de la souche de SARS-CoV issue du prélévement 
répertorié sous le n° 031589, telle que définie ci-dessus, laquelle sequence correspondant a celle située entre le nu- 
cléotide en position 28933 a 29727 (SEQ ID NO :40), en référence a la sequence Genbank n° d’accés AY274119.3, se 
termine par une série de nucléotides a. 


2.6) ORF1a et ORF1b 


[0209] L’amplification de la région 5’ contenant les ORFla et ORFlb du génome du SARS-CoV issu du prélévement 
031589 a été réalisée en pratiquant des réactions de RT-PCR suivies de PCR nichées selon les mémes principes que 
ceux précédemment décrits pour les autres ORF. Les fragments amplifiés sont chevauchants sur plusieurs dizaines de 
bases, permettant ainsi la reconstruction informatique de la sequence complete de cette partie du genome. En moyenne, 
les fragments amplifiés sont de deux kilobases. 



































[0210] 14 fragments chevauchants dénommés LO a L12 ont ainsi été amplifiées a l'aide des amorces suivantes : 
Tableau Il: Amorces utilisées pour l’amplification de la région 5’(ORF1a et ORF1b) 
REGION 
aha aaa Amorce sens RT- Amorce antisens Amorce sens PCR Amorce antisens 
tient pas compte PCR RT-PCR nichée PCR nichée 
des amorces) 
LO 50-480 S/LO/F1/+30 S/LO/R1/-481 
L1 231-2240 S/L1/F 1/+147 S/L1/R1/-2336 S/L1/F2/+211 S/L1/R2/-2241 
L2 2156-4167 S/L2/F 1/+2033 S/L2/R1/-4192 S/L2/F2/+2136 S/L2/R2/-4168 
L3 3913-5324 S/L3bis/F 1/+3850 S/L3bis/R1/-5365 S/L3bis/F2/+3892 S/L3bis/R2/-5325 
L4b 4952-6023 S/L4b/F 1/+4878 S/L4b/R1/-6061 S/L4b/F2/+4932 S/L4b/R2/-6024 
L4 5325-7318 S/L4/F 1/+5272 S/L4/R1/-7392 S/L4/F2/+5305 S/L4/R2/-7323 
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(suite) 
REGION 
S OUENCEE ae Amorce sens RT- Amorce antisens Amores sens PCR Amorce antisens 
fient pas compte PCR RT-PCR nichée PCR nichée 
des amorces) 
L5 7296-9156 S/L5/F 1/+7111 S/L5/R1/-9253 S/L5/F2/+7275 S/L5/R2/-9157 
L6 9053-11066 S/L6/F1/+8975 S/L6/R1/-11151 S/L6/F2/+9032 S/L6/R2/-11067 
L7 10928-12962 S/L7/F 1/+10883 S/L7/R1/-13050 S/L7/F2/+10928 S/L7/R2/-12963 
L8 12835-14834 S/L8/F 1/+12690 S/L8/R1/-14857 S/L8/F2/+12815 S/L8/R2/-14835 
L9 14765-16624 S/L9/F 1/+14688 S/L9/R1/-16678 S/L9/F2/+14745 S/L9/R2/-16625 
L10 16534-18570 S/L10/P1/+16451 S/L10/R1/-18594 S/L10/F2/+16514 S/L10/R2/-18571 
L11 18521-20582 S/L11/F1/+18441 S/L11/R1/-20612 S/L11/F2/+18500 S/L11/R2/-20583 
L12 20338-22205. S/L12/F 1/+20279 S/L12/R1/-22229 S/L12/F2/+20319 $/L12/R2/-22206 























[0211] Tous les fragments ont été amplifiés dans les conditions suivantes, excepté le fragment LO qui a été amplifié 
comme décrit ci-dessus pour |'ORF-M : 


- RT-PCR: 30 mina 42°C, 15 mina 55°C, 2 min a 94°C, puis l’ADNc obtenu est amplifié dans les conditions suivantes : 
40 cycles comprenant : une étape de dénaturation a 94°C pendant 15 sec, une étape d’hybridation a 58°C pendant 
30 sec puis une étape d’élongation a 68°C pendant 1 min 30 sec, avec 5 sec d’élongation supplémentaire a chaque 
cycle, puis une étape finale d’élongation a 68°C pendant 7 min. 


- PCRnichée : une étape initiale de dénaturation a 94°C pendant 2 min est suivie de 3 cycles comprenant : une étape 
de dénaturation a 94°C pendant 15 sec, une étape d’hybridation a 60°C pendant 30 sec puis une étape d’élongation 
a 72°C pendant 1 min 30 sec, avec 5 sec d’élongation supplémentaire a chaque cycle, puis une étape finale 
d’élongation a 72°C pendant 7 min. 














[0212] Les produits d’amplifications ont été sequencés a l’aide des amorces définies dans le Tableau Ill ci-aprés : 
Tableau Ill : Amorces utilisées pour le sequengage de la région 5’ (ORF1aet ORF1b) 
Noms Séquences (SEQ ID NO: 76 a 139) 
S/L3/+/4932 5’-CCACACACAGCTTGTGGATA-3’ 
S/L4/+/6401 5’-CCGAAGTTGTAGGCAATGTC-3’ 
S/L4/+/6964 5’-TTTGGTGCTCCTTCTTATTG-3’ 
S/L4/-/6817 5’-CCGGCATCCAAACATAATTT-3’ 
S/L5/-/7633 5’-TGGTCAGTAGGGTTGATTGG-3’ 
S/L5/-/8127 5’-CATCCTTTGTGTCAACATCG-3’ 
S/L5/-/8633 5’-GTCACGAGTGACACCATCCT-3’ 
S/L5/+/7839 5’-ATGCGACGAGTCTGCTTCTA-3’ 
S/L5/+/8785 5’-TTCATAGTGCCTGGCTTACC-3’ 
S/L5/+/8255 5’-ATCTTGGCGCATGTATTGAC-3’ 
S/L6/-/9422 5’-TGCATTAGCAGCAACAACAT-3’ 
S/L6/-/9966 5’-TCTGCAGAACAGCAGAAGTG-3’ 
S/L6/-/10542 5’-CCTGTGCAGTTTGTCTGTCA-3’ 
S/L6/+/10677 5’-CCTTGTGGCAATGAAGTACA-3’ 
S/L6/+/10106 5’-ATGTCATTTGCACAGCAGAA-3’ 
S/L6/+/9571 5’-CTTCAATGGTTTGCCATGTT-3’ 
S/L7/-/11271 5’-TGCGAGCTGTCATGAGAATA-3’ 
S/L7/-/11801 5’-AACCGAGAGCAGTACCACAG-3’ 
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(suite) 

Noms Séquences (SEQ ID NO: 76 a 139) 
S/L7/-/12383 5’-TTTGGCTGCTGTAGTCAATG-3’ 
S/L7/+/12640 5’-CTACGACAGATGTCCTGTGC-3’ 
S/L7/+/12088 5’-GAGCAGGCTGTAGCTAATGG-3’ 
S/L7/+/11551 5’-TTAGGCTATTGTTGCTGCTG-3’ 
S/L8/-13160 5’-CAGACAACATGAAGCACCAC-3’ 
S/L8/-/13704 5’-CGCTGACGTGATATATGTGG-3’ 
S/L8/-14284 5’-TGCACAATGAAGGATACACC-3’ 
S/L8/+/14453 5’-ACATAGCTCGCGTCTCAGTT-3’ 
S/L8/+/13968 5’-GGCATTGTAGGCGTACTGAC-3’ 
S/L8/+/13401 5’-GTTT GCGGTGTAAGTGCAG-3’ 


S/L9/-15098 
S/L9/-15677 
S/L9/-16247 
S/L9/+16323 
S/L9/+15858 
S/L9/+15288 
S/L10/-16914 
S/L10/-17466 
S/L10/-18022 
S/L10/+18245 
S/L10/+17663 
S/L10/+17061 
S/L11/-/18877 
S/L11/-19396 
S/L11 /-20002 
S/L11 /+20245 
S/L11/+/19611 
S/L11/+/19021 
SARS/L1/F3/+800 
SARS/L1/F4/+1391 
SARS/L1/F5/+1925 
SARS/L1/R3/-1674 
SARS/L1/R4/-1107 
SARS/L1/R5/-520 
SARS/L2/F3/+2664 
SARS/L2/F4/+3232 
SARS/L2/F5/+3746 
SARS/L2/R3/-3579 
SARS/L2/R4/-2991 
SARS/L2/R5/-2529 
SARS/L3/F3/+4708 
SARS/L3/F4/+5305 
SARS/L3/F5/+5822 
SARS/L3/R3/-5610 
SARS/L3/R4/-4988 
SARS/L3/R5/-4437 





5’-TAGTGGCGGCTATTGACTTC-3’ 
5’-CTAAACCTTGAGCCGCATAG-3’ 
5’-CATGGTCATAGCAGCACTTG-3’ 
5’-CCAGGTTGTGATGTCACTGAT-3’ 
5’-CCTTACCCAGATCCATCAAG-3’ 
5’-CGCAAACATAACACTTGCTG-3’ 
5’-AGTGTTGGGTACAAGCCAGT-3’ 
5’-GTTCCAAGGAACATGTCTGG-3’ 
5’-AGGTGCCTGTGTAGGATGAA-3’ 
5’-GGGCTGTCATGCAACTAGAG-3’ 
5’-TCTTACACGCAATCCTGCTT-3’ 
5’-TACCCATCTGCTCGCATAGT-3’ 
5’-GCAAGCAGAATTAACCCTCA-3’ 
5’-AGCACCACCTAAATTGCATC-3’ 
5’-TGGTCCCTTTGAAGGTGTTA-3’ 
5’-TCGAACACATCGTTTATGGA-3’ 
5’-GAAGCACCTGTTTCCATCAT-3’ 
5’-ACGATGCTCAGCCATGTAGT-3’ 
5’-GAGGTGCAGTCACTCGCTAT-3’ 
5’-CAGAGATTGGACCTGAGCAT-3’ 
5’-CAGCAAACCACTCAATTCCT-3’ 
5’-AAATGATGGCAACCTCTTCA-3’ 
5’-CACGTGGTTGAATGACTTTG-3’ 
5’-ATTTCTGCAACCAGCTCAAC-3’ 
5’-CGCATTGTCTCCTGGTTTAC-3’ 
5’-GAGATTGAGCCAGAACCAGA-3’ 
5’-ATGAGCAGGTTGTCATGGAT-3’ 
5’-CTGCCTTAAGAAGCTGGATG-3’ 
5’-TTTCTTCACCAGCATCATCA-3’ 
5’-CACCGTTCTTGAGAACAACC-3’ 
5’-TCTTTGGCTGGCTCTTACAG-3’ 
5’-GCTGGTGATGCTGCTAACTT-3’ 
5’-CCATCAAGCCTGTGTCGTAT-3’ 
5’-CAGGTGGTGCAGACATCATA-3’ 
5’-AACATCAGCACCATCCAAGT-3’ 
5’-ATCGGACACCATAGTCAACG-3’ 








[0213] Les séquences des fragments LO a L12 de la souche de SARS-CoV issue du prélevement répertorié sous le 
n° 031589, correspondent respectivement aux séquences SEQ ID NO :41 a SEQ ID NO :54 dans la liste de sequences 
jointe en annexe. Parmi ces séquences, seule celle correspondant aux fragments L5 comporte une différence nucléo- 
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tidique par rapport a la séquence correspondante de l’isolat AY278741-Urbani. Cette mutation t/c en position 7919 
aboutit a une modification de la sequence en acides aminés de la protéine correspondante, codée par |’ORF la: en 
position 2552, une valine (codon gtt ; AY278741) est changée en alanine (codon gct) dans la souche de SARS-CoV 
031589. En revanche, aucune mutation n’a été identifiée par rapport a la séquence correspondante de [l’isolat 
AY274119.3-Tor2. Les autres fragments ne présentent pas de différences par rapport aux séquences correspondantes 
des isolats Tor2 et Urbani. 


Exemple 2 : Production et purification de protéines N et S recombinantes de la souche de SARS-CoV issue du 
prélevement répertorié sous le numéro 031589 


[0214] La protéine entiére N et deux fragments polypeptidiques de la protéine S de la souche de SARS-CoV issue 
du prélévement répertorié sous le numéro 031589 ont été produites chez E. coli, sous forme de protéines de fusion 
comprenant une étiquette polyhistidine N-ou C-terminale. Dans les deux polypeptides S, les sequences hydrophobes 
N et C-terminales de la protéine S (peptide signal : positions 1 a 13 et hélice transmembranaire : positions 1196 a 1218) 
ont été délétées alors que I’hélice B (positions 565 a 687) et les deux motifs de type coiled-coils (positions 895 a 980 et 
1155 a 1186) de la protéine S ont été préservés. Ces deux polypeptides sont constitués par : un fragment long (S,) 
correspondant aux positions 14 a 1193 de la sequence en acides aminés de la protéine S et un fragment court (S,) 
correspondant aux positions 475 a 1193 de la séquence en acides aminés de la protéine S. 1) Clonage des ADNc N, 
S, et S, dans les vecteurs d’expression pIVEX2.3 et 


pIVEX2.4 


[0215] Les ADNc correspondant a la protéine N et aux fragments S, et S, ont été amplifiés par PCR dans des 
conditions standard, a l'aide de l’ADN polymérase Platinium Pfx® (INVITROGEN). Les plasmides SRAS-N et SRAS-S 
ont été utilisés comme matrice et les oligonucléotides suivants comme amorces : 


5’-CCCATATGTCTGATAATGGACCCCAATCAAAC-3’ (N sens, SEQ ID NO :55) 
5’-CCCCCGGGTGCCTGAGTTGAATCAGCAGAAGC-3’ (N antisens, SEQ ID NO :56) 
5’-CCCATATGAGTGACCTTGACCGGTGCACCAC-3’ (S, sens, SEQ ID NO :57) 
5’-CCCATATGAAACCTTGCACCCCACCTGCTC-3’ (S; sens, SEQ ID NO :58) 
5’-CCCCCGGGTTTAATATATTGCTCATATTTTCCC-3’ (Sc. et S, antisens, SEQ ID NO :59). 


[0216] Les amorces sens introduisent un site Ndel (souligné) alors que les amorces antisens introduisent un site Xmal 
ou Smal (souligné). Les 3 produits d’amplification on été purifiés sur colonne (kit QlAquick PCR Purification, QIAGEN) 
et clonés dans un vecteur approprié. L’ADN plasmidique purifié des 3 constructions (kit QIAFilter Midi Plasmid, QIAGEN) 
a été vérifié par séquengage et digéré par les enzymes Ndel et Xmal. Les 3 fragments correspondants aux ADNc N, 
S, et Sc ont été purifiés sur gel d’agarose puis insérés dans les plasmides pIlVEX2.3MCS (étiquette polyhistidine C- 
terminale) et plVEX2.4d (étiquette polyhistidine N-terminale) préalablement digérés par les mémes enzymes. Aprés 
vérification des constructions, les 6 vecteurs d’expressions ainsi obtenus (plV2.3N, plV2.3S¢, plV2.3S,, plV2.4N, 
plV2.4S. également dénommeé plV2.4S,, plV2.4S,) ont été ensuite utilisés, d’une part pour tester l’expression des 
protéines in-vitro, et d’autre part pour transformer la souche bactérienne BL21(DE3)pDIA17 (NOVAGEN). Ces cons- 
tructions codent pour des protéines dont la masse moléculaire attendue est la suivante : plV2.3N (47174 Da), plV2.3S, 
(82897 Da), pIlV2.3S, (132056 Da), plV2.4N (48996 Da), plV2.4S, (81076 Da) et plV2.4S, (133877 Da). Des bactéries 
transformées par plV2.3N ont été déposées a la CNCM le 23 octobre 2003, sous le numéro I-3117, et des bactéries 
transformées par plV2.4S, ont été déposées a la CNCM le 23 octobre 2003, sous le numéro |-3118. 


2) Analyse de Il’expression des protéines recombinantes in-vitro et in vivo 


[0217] L’expression de protéines recombinantes a partir des 6 vecteurs recombinants a été testée, dans un premier 
temps, dans un systéme in-vitro (RTS100, Roche). Les protéines produites in vitro, aprés une incubation des vecteurs 
recombinants pIVEX, 4h a 30°C, dans le systeme RTS100, ont été analysées par westem-blot a l'aide d’un anticorps 
anti-(his)g couplé a la péroxydase. Le résultat d’expression in-vitro (Figure 1) montre que seule la protéine N est exprimée 
en quantités importantes, cela quelle que soit la position, N- ou C-terminale, de l’étiquette polyhistidine. Dans une 
seconde étape, l’expression des protéines N et S a été testée in-vivo a 30°C dans du milieu LB, en présence ou en 
l'absence d’inducteur (IPTG 1mM). La protéine N est trés bien produite dans ce systéme bactérien (Figure 2) et se 
retrouve principalement dans une fraction soluble apres lyse des bactéries. En revanche, la version longue de S (S, ) 
est trés peu produite et complétement insoluble (Figure 3). La version courte (Sc) présente également une trés faible 
solubilité, mais un taux d’expression beaucoup plus élevé que celui de la version longue. Par ailleurs, la construction 
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Sc fusionnée a une étiquette polyhistidine en position C-terminale présente une taille plus faible que celle attendue. 
Une expérience d’immunodétection avec un anticorps anti-polyhistidine a montré que cette construction était incompléte. 
En conclusion, les deux constructions, plV2.3N et plV2.4S,, exprimant respectivement la protéine N entiére fusionnée 
a l’étiquette polyhistidine en C-terminal et la protéine S courte fusionnée a |’étiquette polyhistidine en N-terminal, ont 
été retenues pour produire les deux protéines en grande quantité afin de les purifier. Les plasmides plV2.3N et plV2.4S, 
ont été déposés respectivement sous le n° |-3117 et |-3118 auprés de la CNCM, 25 rue du Docteur Roux, 75724 PARIS 
15, le 23 octobre 2003. 


3) Analyse de I’activité antigénique des protéines recombinantes 


[0218] L’activité antigenique des protéines N, S, et Sc a été testée par western-blot, a l’aide de deux échantillons de 
sérum, provenant d’un méme patient infecté par le SARS-CoV, prélevés 8 jours (M12) et 29 jours-(M13) aprés le début 
des symptémes du SRAS. Le protocole expérimental est comme décrit a l’exemple 3. Les résultats illustrés par la figure 
4 montrent (i) la séroconversion du patient, et (ii) que la protéine N posséde une plus forte réactivité antigénique que la 
protéine S courte. 


4) Purification de la protéine N a partir de plV2.3N 


[0219] Plusieurs expériences de purification de la protéine N, produite a partir du vecteur plV2.3N, ont été réalisées 
selon le protocole suivant. Les bactéries BL21(DE3)pDIA17, transformées par le vecteur d’expression plV2.3N, ont été 
cultivées a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml d’ampicilline, et induites par 1 mM IPTG quand 
la densité cellulaire, équivalente a Agog = 0,8, est atteinte (environ 3 heures). Apres 2 heures de culture en présence 
d’inducteur, les cellules ont été récupérées par centrifugation (10 min a 5000 rpm), remises en suspension dans le 
tampon de lyse (50 mM NaH,PO,, NaCl 0,3 M, 20 mM imidazole, pH 8 contenant le mélange d’inhibiteurs de protéases 
Complete®, Roche), et lysées par la presse de French (12000 psi). Aprés centrifugation du lysat bactérien (15 min a 
12000 rpm), le surnageant (50 ml) a été déposé a un débit de Iml/min sur une colonne (15 ml) de chélation métallique 
(Ni-NTA superflow, Qiagen), équilibrée par le tampon de lyse. Aprés lavage de la colonne par 200 ml de tampon de 
lyse, la protéine N a été éluée par un gradient d’imidazole (20 +250 mM) en 10 volumes de colonne. Les fractions 
contenant la protéine N ont été rassemblées et analysées par électrophorése en gel de polyacrylamide en conditions 
dénaturantes puis coloration au bleu de Coomassie. Les résultats illustrés par la figure 5 montrent que le protocole 
employé permet de purifier la protéine N avec une homogénéité trés satisfaisante (95%) et un rendement moyen de 15 
mg de protéine par litre de culture. 


5) Purification de la protéine Sc_ a partir de plV2.4S¢_ (plV2.4S)) 


[0220] Le protocole suivi pour purifier la protéine S courte est trés différent de celui décrit ci-dessus car la protéine 
est fortement agrégée dans le systéme bactérien (corps d’inclusion). Les bactéries BL21(DE3)pDIA17, transformées 
par le vecteur d’expression plV2.4S, ont été cultivées a 30°C dans 1 litre de milieu de culture contenant 0,1 mg/ml 
d’ampicilline, et induites par 1 mM IPTG quand la densité cellulaire, équivalente a Agog = 0,8, est atteinte (environ 3 
heures). Aprés 2 heures de culture en présence d’inducteur, les cellules ont été recupérées par centrifugation (10 min 
a 5000 rpm), remises en suspension dans le tampon de lyse (0,1 M Tris-HCl, EDTA 1 mM, pH 7,5), et lysées par la 
presse de French (1200 psi). Aprés centrifugation du lysat bactérien (15 min a 12000 rpm), le culot a été remis en 
suspension dans 25 ml de tampon de lyse contenant 2% Triton X100 et 10 mM B-mercaptoéthanol, puis centrifugé 
pendant 20 min a 12000 rpm. Le culot a été remis en suspension dans un tampon Tris-HCI 10 mM contenant 7 M urée, 
et mis en agitation douce pendant 30 min a température ambiante. Ce dernier lavage des corps d’inclusion avec 7 M 
urée est nécessaire pour éliminer la plupart des protéines membranaires d’E. coli qui co-sédimentent avec la protéine 
Sc agrégée. Apres une derniére centrifugation pendant 20 min a 12000 rpm, le culot final est remis en suspension dans 
le tampon Tris-HCI 10 mM. L’analyse électrophorétique de cette préparation (Figure 6) montre que la protéine S courte 
peut étre purifige avec une homogénéité satisfaisante (environ 90%) a partir des corps d’inclusion (extrait insoluble). 


Exemple 3 : Immunodominance de la protéine N 
[0221] Laréactivité des anticorps présents dans le sérum des patients atteints de pneumopathie atypique causée par 


le coronavirus associé au SRAS (SARS-CoV), vis-a-vis des différentes protéines de ce virus, a été analysée par western- 
blot dans les conditions décrites ci-aprés. 
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1) Matériel 


a) lysat de cellules infectées par le SARS-CoV 





[0222] Descellules Vero E6 (2x10®) ont été infectées par le SARS-CoV (isolat répertorié sous le numéro FFM/MA104) 
A une multiplicité d’infection (M.O.1.) de 10-1 ou 10-2 puis incubées dans du milieu DMEM contenant 2% de SVF, a 35°C 
dans une atmosphere contenant 5% de CO,. 48 heures plus tard, le tapis cellulaire a été lave avec du PBS puis lysé 
avec 500 wl de tampon de dépét préparé selon Laemmli et contenant du B-mercaptoéthanol. Les échantillons ont ensuite 
été bouillis 10 minutes puis soniqués 3 fois 20 secondes. 


b) anticorps 


b,) sérum de patient atteint de pneumopathie atypique 





[0223] Lesérum référencé au Centre National de Référence des virus influenzae (Région-Nord) sous le N° 20033168 
est celui d’un patient frangais atteint d'une pneumopathie atypique causée par le SARS-CoV prélevé au jour 38 aprés 
le début des symptémes ; le diagnostic d’infection par le SARS-CoV a été réalisé par RT-PCR nichée et PCR quantitative. 


bz) sérums polyclonaux de lapin monospécifiques dirigés contre la protéine N ou la protéine S 





[0224] Les sérums sont ceux produits a partir des protéines recombinantes N et Sc (exemple 2), selon le protocole 
d’immunisation décrit a exemple 4 ; il s’agit du sérum du lapin P13097 (sérum anti-N) et du sérum du lapin P11135 
(sérum anti-S). 


2) Méthode 


[0225] 20 ul de lysat de cellules infectées par le SARS-CoV a des M.O.I. de 1071 et 10° et, a titre de contrdle, 20 wl 
d’un lysat de cellules non infectées (mock) ont été séparés sur un gel SDS a 10% de polyacrylamide puis transférés 
sur une membrane de nitrocellulose. Aprés blocage dans une solution de PBS/lait 5%/Tween 0,1% et lavage en PBS/ 
Tween 0,1%, cette membrane a été hybridée pendant une nuit a 4°C avec: (i) l’immun-sérum N° 20033168 dilué au 
1/300, 1/1000 et 1/3000 dans le tampon PBS/BSA 1%/Tween 0,1%, (ii) le sérum du lapin P13097 (sérum anti-N) dilué 
au 1/50000 dans le méme tampon et (iii) le sérum du lapin P11135 (sérum anti-S) dilué au 1/10000 dans le méme 
tampon. Apres lavage en PBS/Tween, une hybridation secondaire a été réalisée a l’aide, soit d’anticorps polyclonaux 
de mouton dirigés contre les chaines lourdes et légéres des immunoglobulines G humaines et couplés a la peroxidase 
(NA933V, Amersham), soit d’anticorps polyclonaux d’ane dirigés contre les chaines lourdes et legéres des immunoglo- 
bulines G de lapin et couplés a la peroxidase (NA934V, Amersham). Les anticorps fixés ont été révélés a l’aide du kit 
ECL+ (Amersham) et de films d’autoradiographie Hyperfilm MP (Amersham). Une échelle de masse moléculaire (kDa) 
est portée sur la figure. 


3) Résultats 


[0226] La figure 7 montre que trois polypeptides de masse moléculaire apparente 35, 55 et 200 kDa sont détectés 
spécifiquement dans les extraits de cellules infectées par le SARS-CoV. 

[0227] Afin d’identifier ces polypeptides, deux autres immunoempreintes (figure 8) ont été réalisées sur les mémes 
échantillons et dans les mémes conditions avec des anticorps polyclonaux de lapins spécifique de la nucléoprotéine N 
(lapin P13097, figure 8A) et de la protéine de spicule S (lapin P11135, figure 8B) Cette expérience montre que le 
polypeptide de 200 kDa correspond a la glycoprotéine de spicule S du SARS-CoV, que le polypeptide de 55 kDa 
correspond ala nucléoprotéine N tandis que le polypeptide de 35 kDa représente vraisemblablement une forme tronquée 
ou dégradée de la N. 

[0228] Les données présentées dans la figure 7 montrent donc que le sérum 20033168 réagit fortement avec la N et 
beaucoup plus faiblement avec la S du SARS-CoV, puisque les polypeptides de 35 et 55 kDa sont révélés sous la forme 
de bandes intenses pour des dilutions de 1/300, 1/1000 et 1/3000 de l’immunsérum alors que le polypeptide de 200 
kDa n’est que faiblement révélé pour une dilution de 1/300. On peut noter également qu’aucun autre polypeptide du 
SARS-CoV n’est détecté pour des dilutions supérieures au 1/300 du sérum 20033168. 

[0229] Cette expérience indique que la réponse en anticorps spécifique de la N du SARS-CoV domine les réponses 
en anticorps spécifiques des autres polypeptides du SARS-CoV et en particulier la réponse en anticorps dirigée contre 
la glycoprotéine S. Elle indique une immunodominance de la nucléoprotéine N lors des infections humaines par le SARS- 
CoV. 
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Exemple 4 : Réparation d’anticorps polyclonaux monospécifiques dirigés contre les protéines N et S du co- 
ronavirus associé au SRAS (SARS-CoV) 


1) Matériel et méthode 


[0230] Trois lapins (P13097, P13081, P13031) ont été immunisés avec le polypeptide recombinant purifié correspon- 
dant a l’intégralité de la nucléoprotéine (N), préparé selon le protocole décrit a l’exemple 2. Aprés une premiére injection 
de 0,35 mg par lapin de protéine émulsionnée en adjuvant complet de Freund (voie intradermique), les animaux ont 
recus 3 injections de rappel a 3 puis 4 semaines d’intervalle, de 0,35 mg de protéine recombinante émulsionnée en 
adjuvant incomplet de Freund. 

[0231] Trois lapins (P11135, P13042, P14001) ont été immunisés avec le polypeptide recombinant correspondant au 
fragment court de la protéine S (S,), produit comme décrit a l’exemple 2. Comme ce polypeptide est retrouve principa- 
lement sous la forme de corps d’inclusion dans le cytoplasme bactérien, les animaux ont recus 4 injections intra-dermiques 
a 3-4 semaines d’intervalle d’une préparation de corps d’inclusion correspondant a 0,5 mg de protéine recombinante 
émulsionnée en adjuvant incomplet de Freund. Les 3 premiéres injections ont été réalisées avec une préparation de 
corps d’inclusion préparés selon le protocole décrit a l’exemple 2, tandis que la quatriéme injection a été réalisée avec 
une préparation de corps d’inclusion qui ont été préparés selon le protocole décrit a l’exemple 2 puis purifiés sur gradient 
de saccharose et lavés en 2 % Triton X100. 

[0232] Pour chaque lapin, un sérum pré-immun (p.i.) a été préparé avant la premiére immunisation et un immun- 
sérum (I.S.) 5 semaines aprés la quatriéme immunisation. 

[0233] Dans un premier temps, la réactivité des sérums a été analysée par test ELISA vis a vis de préparations de 
protéines recombinantes semblables a celles utilisées pour les immunisations ; les tests ELISA ont été réalisés selon 
le protocole et avec les réactifs tels que décrits a l’exemple 6. 

[0234] Dans un deuxiéme temps, la réactivité des sérums a été analysée en réalisant une immunoempreinte (western 
blot) d’un lysat de cellules infectées par le SARS-CoV, en suivant le protocole tel que décrit a l’exemple 3. 


2) Résultats 


[0235] Les tests ELISA (figure 9) démontrent que les préparations de protéine N recombinante et de corps d’inclusion 
du fragment court de la protéine S (S,) sont immunogeénes chez I’animal et que le titre des sérums immuns est élevé 
(plus de 1/25000). 

[0236] L’immunoempreinte (figure 8) montre que le sérum immun du lapin P13097 reconnait deux polypeptides pré- 
sents dans les lysats de cellules infectées par le SARS-CoV : un polypeptide dont la masse moléculaire apparente 
(50-55 kDa selon les expériences) est compatible avec celle de la nucléoprotéine N (422 résidus, masse moléculaire 
prédite de 46 kDa) et un polypeptide de 35 kDa, qui représente vraisemblablement une forme tronquée ou dégradée 
de laN. 

[0237] Cette expérience montre également que le sérum du lapin P11135 reconnait principalement un polypeptide 
dont la masse moléculaire apparente (180-220 kDa selon les expériences) est compatible avec une forme glycosylée 
de la S (1255 résidus, chaine polypeptidique non glycosylée de 139 kDa), ainsi que des polypeptides plus légers, qui 
représentent vraisemblablement des formes tronquées et/ou non glycosylées de la S. 

[0238] Enconclusion, l'ensemble de ces expériences démontrent que des polypeptides recombinants exprimés chez 
E. coli et correspondant aux protéines N et S du SARS-CoV permettent d’induire chez l’animal des anticorps polyclonaux 
capables de reconnaitre les formes natives de ces protéines. 


Exemple 5 : Préparation d’anticorps polyclonaux monospécifiques dirigés contre les protéines M et E du 
coronavirus associé au SRAS (SARS-CoV) 


1) Analyse de la structure des protéines M et E 
a) Protéine E 


[0239] La structure de la protéine E du SARS-CoV (76 acides aminés) a été analysée in silico , a aide de différents 
logiciels comme signalP v1.1, NetNGlyc 1.0, THMM 1.0 et 2.0 (Krogh et al., 2001, J. Mol. Biol., 305(3):567-580) ou 
encore TOPPRED (von Heijne, 1992, J. Mol. Biol. 225, 487-494). L’analyse montre que ce polypeptide non glycosylé 
est une protéine membranaire de type 1, contenant une seule hélice transmembranaire (aa 12-34 d’aprés THMM), et 
dontla plus grande partie du domaine hydrophile (42 résidus) est localisée a l’extrémité C-terminale et vraisemblablement 
a l’intérieur de la particule virale (endodomaine). On peut noter une inversion dans la topologie prédite par les versions 
1.0 (N-ter est externe) et 2.0 (N-ter est interne) du logiciel THMM, mais que d’autres algorithmes, notamment TOPPRED 
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et THUMBUP (Zhou et Zhou, 2003, Protein Science 12 :1547-1555) confirment une localisation externe de |’extrémité 
N-terminale de E. 


b) Protéine M 


[0240] Une analyse similaire réalisée sur la protéine M du SARS-CoV (221 acides aminés) montre que ce polypeptide 
ne posséde pas de peptide signal (d’aprés le logiciel signalP v1.1) mais trois domaines transmembranaires (résidus 
15-37, 50-72, 77-99 d’aprés THMM2.0) et un grand domaine hydrophile (aa 100-221) localisé a l’intérieur de la particule 
virale (endodomaine). Elle est vraisemblablement glycosylée sur l’asparagine en position 4 (d’aprés NetNGlyc 1.0). 
[0241] Ainsi, en accord avec les données expérimentales connues pour les autres coronavirus, il est remarquable 
que les deux protéines M et E présentent des endodomaines correspondant a la majeure partie des polypeptides et des 
ectodomaines de trés petite taille. 


-  l'ectodomaine de E correspond vraisemblablement aux résidus 1 a 11 ou 1 a 12 de la protéine : MYSFVSEETGT 
(L), SEQID NO : 70. En effet, la probabilité associée a la localisation transmembranaire du résidu 12 est intermédiaire 
(0,56 d’aprés THMM 2.0). 

-  l'ectodomaine de M correspond vraisemblablement aux résidus 2 a 14 de la protéine : ADNGTITVEELKQ, SEQ ID 
NO : 69. En effet, la méthionine N-terminale de M est trés probablement clivée du polypeptide mature car le résidu 
en position 2 est une Alanine (Varshavsky, 1996, 93:12142-12149). 


[0242] Par ailleurs, l’analyse de I’hydrophobicité (Kyte & Doolittle, Hopp & Woods) de la protéine E met en évidence 
que l’extrémité C-terminale de l’endodomaine de E est hydrophile et donc vraisemblablement exposée a la surface de 
ce domaine. Ainsi, un peptide synthétique correspondant a cette extrémité est un bon candidat immunogéne pour induire 
chez l’'animal des anticorps dirigés contre l’endodomaine de E. En conséquence, un peptide correspondant aux 24 
résidus C-terminaux de E a été synthétisé. 


2) Préparation d’anticorps dirigés contre l’ectodomaine des protéines M et E et l’endodomaine de la protéine E 


[0243] Les peptides M2-14 (ADNGTITVEELKQ, SEQ ID NO: 69), E1-12 (MYSFVSEETGTL, SEQ ID NO: 70) et 
E53-76 (KPTVYVYSRV KNLNSSEGVP DLLV, SEQ ID NO : 71) ont été synthétisés par Neosystem. Ils ont été couplés 
a la KLH (Keyhole Limpet Heinocyanin) a l'aide du MBS (m-maleimidobenzoyl-N-hydroxysuccinimide ester) via une 
cystéine ajoutée au cours de la synthése soit en N-terminal du peptide (cas de E53-76) soit en C-terminal (cas de M2-14 
et E1-12). 

[0244] Deux lapins ont été immunisés avec chacun des conjugués, en suivant le protocole d’immunisation suivant : 
aprés une premiére injection de 0,5 mg de peptide couplé a la KLH et émulsionné en adjuvant complet de Freund (voie 
intradermique), les animaux recgoivent 2 a 4 injections de rappel a 3 ou 4 semaines d’intervalle de 0,25 mg de peptide 
couplé a la KLH et émulsionné en adjuvant incomplet de Freund. 

[0245] Pour chaque lapin, un sérum pré-immun (p.i.) a été préparé avant la premiére immunisation et un immun- 
sérum (I.S.) est préparé 3 a 5 semaines aprés les injections de rappel. 

[0246] La réactivité des sérums a été analysée par western blot a l’aide d’extraits de cellules infectées par le SRAS- 
CoV (figure 43B) ou a l'aide d’extraits de cellules infectées par un virus recombinant de la vaccine exprimant la protéine 
E (VV-TG-E, figure 43A) ou M (VV-TN-M, figure 43C) de l’isolat 031589 du SRAS-CoV. 

[0247] Les immunsérums des lapins 22234 et 22240, immunisés par le conjugué KLH-E53-76, reconnaissent un 
polypeptide d’environ 9 a 10kD, qui est présent dans les extraits de cellules infectées par le SRAS-CoV mais absent 
dans les extraits de cellules non infectées (figure 43B). La masse apparente de ce polypeptide est compatible avec la 
masse prédite de la protéine E, qui est de 8,4 kD. De fagon similaire, l’immunsérum du lapin 20047, immunisé par le 
conjugué KLH-E1-12, reconnait un polypeptide présent dans les extraits de cellules infectées par le virus VV-TG-E, 
dont la masse molaire apparente est compatible avec celle de la protéine E (figure 43A). 

[0248] L’immunsérum des lapin 20013 et 20080, immunisés par le conjugué KLH-M2-14, reconnait un polypeptide 
présent dans les extraits de cellules infectées par le virus VV-TN-M (figure 43C), dont la masse molaire apparente (18 
kD environ) est compatible avec celle de la glycoprotéine M, qui est de 25,1 kD et présente un point isoélectrique élevé 
(9.1 pour le polypeptide nu). 

[0249] Cesrésultats démontrent que les peptides El-12 et E53-76 d’une part et le peptide M2-14 d’autre part permettent 
d’induire chez l’animal des anticorps polyclonaux capables de reconnaitre les formes natives des protéines E et M 
respectivement du SRAS-CoV. 
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Exemple 6 : Analyse de la réactivité en ELISA de la protéine N recombinante, vis-a-vis de sérums de patients 
atteints de SRAS 


1) Matériel 


[0250] L’antigéne utilisé pour préparer les phases solides est la nucléoprotéine N recombinante purifiée préparée 
selon le protocole décrit a l’exemple 2. 

[0251] Les sérums a tester (Tableau IV) ont été choisis sur la base des résultats d’analyse de leur réactivité par 
immunofluorescence (titre IF-SRAS), vis-a-vis de cellules infectées par le SARS-CoV. 


Tableau IV: Sérums testés en ELISA 









































Référence | N°sérum | Type desérum | Date du Sérum*** | Titre IF-SRAS 

3050 A Témoin na* nt** 

3048 B Témoin na nt 
033168 D Patient 1-SRAS 27/04/03 (J38) 320 
033397 E Patient-1 SRAS 11/05/03 (J52) 320 
032632 F Patient-2 SRAS 21/03103 (J17) 2500 
032791 G Patient-3 SRAS 04/04/03 (J3) <40 
033258 H Patient-3 SRAS 28/04/03 (J27) 160 

*na :non-applicable. ** nt : non-testé. *** les dates indiquées correspondent au nombre 
de jours aprés le début des sympt6émes de SRAS. 











2) Méthode 


[0252] La protéine N (100 wl) diluée a différentes concentrations dans du tampon carbonate 0,1 M, pH 9,6 (1, 2 ou 4 
pg/ml) est distribuée dans les puits de plaques ELISA, puis les plaques sont incubées une nuit a température du 
laboratoire. Les plaques sontlavées avec du tampon PBS-Tween, saturées avec du tampon PBS-lait écrémé-saccharose 
(5 %). Les sérums a tester (100 wl) préalablement dilués (1/50, 1/100, 1/200, 1/400, 1/800, 1/1600 et 1/3200) sont 
ajoutés, puis les plaques sont incubées 1 h a 37° C. Aprés 3 lavages, le conjugué anti-IgG humaines marqué a la 
peroxydase (référence 209-035-098, JACKSON) dilué au 1/18000 est ajouté puis les plaques sont incubées 1h a 37 
°C. Apres 4 lavages, le chromogéne (TMB) et le substrat (H20.) sont ajoutés et les plaques sont incubées 30min a 
température ambiante, a l’abri de la lumiére. La réaction est ensuite arrétée puis l'absorbance a 450 nm est mesurée 
a l'aide d’un lecteur automatique. 


3) Résultats 

[0253] Les tests ELISA (figure 10) démontrent que la préparation de protéine N recombinante est reconnue spécifi- 
quement par les anticorps de sérums de patients atteints de SRAS prélevés en phase tardive de l’infection (= 17 jours 
aprés le début des symptémes) alors qu’elle n’est pas reconnue de facon significative par les anticorps d’un sérum de 
patient prélevé en phase précoce de l’infection (3 jours aprés le début des symptémes) ni par des sérums témoins de 


sujets non atteints de SRAS. 


Exemple 7 : Tests ELISA élaborés pour une détection trés spécifique et sensible d’une infection par le coro- 
navirus associé au SRAS, a partir de sérums de patients 


1) Test ELISA IgG indirect 
a Réactifs 
Préparation des plaques 


[0254] Les plaques sont sensibilisées par une solution de protéine N a 2y.g/mL dans un tampon PBS 10mM pH 7,2, 
rouge de phénol a0,25mL /L. 100 wL de solution sont déposés dans les puits et laissés incubés a température ambiante 
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pendant une nuit. La saturation se fait par un prélavage en tampon PBS 10mM / tween 0,1%, suivi d’un lavage avec 
une solution de saturation PBS, 25% lait /saccharose. 


Diluant serums 

[0255] Tampon TRIS 0,48g/L, PBS 10mM, EDTA 3,7g/L,lait 15% v/v , pH 6,7 

Diluant conjugué 

[0256] Tampon citrate (15g/L), tween 0,5% , sérum bovin 25%, NaCl 12%, lait ecreémé 6% v/v PH 6,5 
Conjugué 

[0257] Conjugué anti-lgG humaines 50X, commercialisés par Bio-Rad : kit Platelia H. pylori ref 72778 
Autres solutions : 


[0258] Solution de lavage R2, Solutions de révélation au TMB R8 diluant, R9 chromogéne, R10 solution d’arrét : 
réactifs commercialisés commercialisées par Bio-Rad (ex : kit Platelia pylori, ref 72778) 


b) Mode opératoire 


[0259] 


Diluer les serums au 1/200 dans le diluant échantillons 

Distribuer 100wL/puits 

Incubation 1h a 37°C 

3 lavages en solution de LAVAGE R2 10x préalablement diluée 10 fois en eau déminé€ralisée (i.e., solution de lavage 
1X) 

Distribuer 100L de conjugué (conjugué 50x a diluer extemporanément dans le diluant conjugué fourni) 
Incubation 1h a 37°C 

4 lavages en solution de lavage 1X 

distribuer 200L/puits de solution de révélation (a diluer extemporanément ex: mL de R9 dans 10mL de R8) 
Incubation 30 min a température ambiante a l’obscurité 

arréter la réaction avec 100L/puits de R10 

LECTURE a 450/620nm 


[0260] Les résultats peuvent étre interprétés en prenant un sérum SEUIL donnant une réponse au dela de laquelle 
les serums testés seront considérés comme positifs. Ce sérum est choisi et dilué de fagon a donner un signal signifi- 
cativement supérieur au bruit de fond. 

2) Test ELISA DOUBLE EPITOPE 

a Réactifs 

Préparation des plaques 

[0261] Les plaques sont sensibilisées par une solution de protéine N a 14.g/mL dans un tampon PBS 10mM pH 7,2, 
rouge de phénol a0,25mL /L. 100 wL de solution sont déposés dans les puits et laissés incubés a température ambiante 
pendant une nuit. La saturation se fait par un prélavage en tampon PBS 10mM / 0,1% tween suivi d’un lavage avec 
une solution de saturation PBS 10mM, lait 25% (V/V) 


Diluant serums et conjugué 


[0262] Tampon TRIS saline 50mMpbké, lait 2% 
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Conjugué 


[0263] II s’agit de la protéine N recombinante purifiée, couplée a la peroxidase selon le protocole de Nakane (Nalcane 
P.K. and Kawaoi A; (1974) : Peroxydase-labeled antibody, a new method of conjugation. The Journal of Histochemistry 
and Cytochemistry Vol22, N)23, pp 1084-1091.), dans des ratios molaires respectifs 1/2. Ce conjugué ProtN POD est 
utilisé a une concentration de 2ug/mL dans du diluant serum/conjugué. 


Autres solutions : 


[0264] Solution de lavage R2, Solutions de révélation au TMB R8, diluant, R9 chromogéne, R10 solution d’arrét : 
réactifs commercialisées par Bio-Rad (ex kit platelia pylori ref 72778). 


b) Mode opératoire 


Tere étape en plaque de "prédilution" 
[0265] 


Mf Diluer chaque sérum au 1/5 dans la plaque de prédilution (48 wL de diluant +12 wL de sérum). 
@ Aprés avoir dilués l’ensemble des serums, distribuer 60L de conjugué 
M@ Le cas échéant, le mélange sérum + conjugué est laissé a incuber. 


2eme étape en plaque de "réaction" 
[0266] 


M@ Transférer 100,Lde mélange/puits dans la plaque de réaction 

Mi Incubation 1h 37°C 

M5 lavages en solution de LAVAGE R2 10x préalablement diluée 10 fois en eau déminéralisée (--> solution de 
lavage 1x) 

Mi distribuer 200uL/puits de solution de révélation (a diluer extemporanément ex:| mL de R9 dans 10mL de R8) 

Mi incubation 30min a température ambiante a |’abri de la lumiére 

M@ arréter la réaction avec 100pL/puits de R10 

M LECTURE a 450/620nm 


[0267] De méme que pour le test ELISA indirect, les résultats peuvent étre interprétés en utilisant un serum "valeur 
seuil". Tout serum ayant une réponse supérieure au sérum valeur seuil sera considéré comme positif. 


2) Résultats 


[0268] Les sérums de patients classés comme cas probables de SRAS de I’hépital francais de Hanoi, Vietnam ou en 
relation avec l’hépital frangais de Hanoi (JYK) ont été analysés en utilisant le test IgG-N indirect et le test N double épitope. 
[0269] Les résultats du test IgG-N indirect (figures 14 et 15) et N double épitope (figures 16 et 17) montrent une 
excellente corrélation entre eux ainsi qu’avec un test ELISA indirect comparant la réactivité des sérums vis-a-vis d’un 
lysat de cellules VeroE6 non infectées ou infectées par le SRAS-CoV (ELISA-lysat SRAS-CoV ; voir le Tableau V ci- 
aprés). Tous les sérums prélevés 12 jours ou plus aprés le début des symptémes ont été trouvés positifs, y compris 
chez des patients pour lesquels l’infection par le virus du SRAS-CoV n’avait pas pu étre documentée par analyse de 
prélévements respiratoires par RT-PCR, vraisemblablement en raison d’un prélévement trop tardif au cours de l’infection 
(2 J12). Dans le cas du patient TTH pour lequel un prélévement nasal réalisé a J7 a été trouvé négatif par RT-PCR, la 
qualité du prélévement pourrait étre en cause. 

[0270] Certains sérums ont été trouvés négatifs alors que la presence de SRAS-CoV a été détectée par RT-PCR. II 
s’agit dans tous les cas de sérums précoces prélevés moins de 10 jours aprés le début des symptémes (ex : sérum # 
032637). Dans le cas d’un patient PTTH (sérum # 032673), seule une suspicion de SRAS était évoquée au moment ou 
les prélevements ont été réalisés. 

[0271] Enconclusion, les tests sérologiques IgG-N indirect et N-double épitope permettent de documenter l’infection 
par le SRAS-CoV chez tous les patients pour des sérums prélevés 12 jours ou plus aprés l’infection. 
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Tableau V : Résultats des tests ELISA 






















































































Num Pvt | Patient | Jour PCR-SARS (1) ELISA lysat IgG-N (2@™e série) | 2Xepitope (2¢me 
SRAS-CoV (2) série) 
033168 JYK 38 POS +++ >5000 NT 
033597 JYK 74 POS NT ~ 5000 NT 
032552 VTIT 8 NEG-J3&J8&J12 NEG <200 <5 
032544 CTP 16 NEG J16&J20 ++ >5000 >>20 
032546 CJF 15 NEG J158&J19 ++ >5000 >>20 
032548 PTL 17 NEG J17&J21 ++ >5000 >>20 
032550 NTH 17 NEG-J178&J21 ++ >5000 >>20 
032553 VTIT 8 NEG-J3&J8&J12 NEG <200 <5 
032554 NTBV 4 POS NEG <200 <5 
032555 NTBV 4 POS NEG <200 
032564 NTP 15 POS ++ >5000 >>20 
032629 NVH 4 POS NEG <200 <5 
032631 BTTX 9 POS NEG <200 <5 
032635 NHH 4 POS NEG <200 <5 
032637 NHB 10 POS NEG <200 <5 
032642 BTTX 9 POS NEG <200 <5 
032643 LTDH 1 POS NEG <200 <5 
032644 NTBV 4 POS NEG <200 <5 
032646 TTH 12 NEG J7&J128&J16 ++ >5000 >>20 
032647 DTH 17 NEG J17&J21 ++ >5000 >>20 
032648 NNT 15 NEG J15&J19 ++ >5000 >>20 
032649 PTH 17 NEG J17&J21 ++ >5000 >>20 
032672 LVV 16 NEG J16&J20 + >5000 >>20 
032673 PTTH NA NEG NEG <200 <5 
032674 PNB 17 NEG J17&J21 ++ >5000 >>20 
032682 VTH 12 NEG J12&J16 ++ >5000 >>20 
032683 DTV 17 NEG J17&J21 + >1000 >>20 


























Notes: 

(1) : Les analyses par RT-PCR ont été réalisées par RT-PCR nichée BNI, LC Artus et LC-N sur des écouvillonnages 
nasaux ou pharyngés; POS signifie qu’au moins un prélévement a été trouvé positif chez ce patient. 

(2) : Laréactivité des sérums dans le test ELISA utilisant un lysat de cellules infectées par le SRAS-CoV a été classée 
en trés fortement réactif (+++), fortement réactif (++), réactif (+) et négatif en fonction de la valeur DO obtenue aux 
dilutions testées 
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Exemple 8 : Détection du coronavirus associé au SRAS (SARS-CoV) par RT-PCR 


1) Mise au point de conditions de RT-PCR en temps réel a l’aide d’amorces spécifiques du géne de la protéine 
de nucléocapside - test "Light Cycler N" 


a) conception des amorces et des sondes 





[0272] Laconception des amorces et sondes a été réalisée a partir de la sequence du génome de la souche de SARS- 
CoV issue du prélevement répertorié sous le numéro 031589, al’aide du programme "Light Cycler Probe Design (Roche)". 
Ainsi les deux séries d’amorces et de sondes suivantes ont été sélectionnées : 


- série 1 (SEQ ID NO: 60, 61, 64, 65): 





[0273] 


-  amorce sens : N/+/28507 : 5’-GGC ATC GTA TGG GTT G-3’ [28507-28522] 

-  amorce antisens : N/-/28774 : 5’'-CAG TTT CAC CAC CTC C-3’ [28774-28759] 

- sonde 1: 5’-GGC ACC CGC AAT CCT AAT AAC AAT GC-fluorescéine 3’ [28561-28586] 
- sonde 2: 5’ Red705 -GCC ACC GTG CTA CAA CTT CCT-phosphate [28588-28608] 


série 2 (SEQ ID NO : 62, 63, 66, 67) 
[0274] 


- amorce sens : N/+/28375 : 5’-GGC TAC TAC CGA AGA G-3’ [28375-28390] 

-  amorce antisens : N/-/28702 : 5’-AAT TAC CGC GAC TAC G-3’ [28702-28687] 

-  sonde 1 : SRAS/N/FL : 5’-ATA CAC CCA AAG ACC ACA TTG GC - fluorescéine 3’ [28541-28563] 

-  sonde 2 : SRAS/N/LC705 : 5’ Red705 -CCC GCA ATC CTA ATA ACA ATG CTG C-phosphate 3’ [28565-28589] 





b) analyse de l’efficacité des deux couples amorces 





[0275] Afin de tester l’efficacité respective des deux couples d’amorces, une amplification par RT-PCR a été réalisée 
sur un ARN synthétique correspondant aux nucléotides 28054-29430 du génome de la souche de SARS-CoV issue du 
prélévement répertorié sous le numéro 031589et contenant la séquence du géne N. 

[0276] De maniére plus précise : 


Cet ARN synthétique a été préparé par transcription in vitro a l'aide de | ARN polymérase du phage T7, d’une matrice 
d’ADN obtenu par linéarisation du plasmide SRAS-N avec l’enzyme Bam H7. Aprés élimination de la matrice d’ADN 
par digestion a l'aide de DNAse 1, les ARN synthétiques sont purifiés par une extraction au phénol-chloroforme 
suivie de deux précipitations successives en acétate d’ammonium et isopropanol. lls sont alors quantifiés par mesure 
de l’'absorbance a 260 nm et leur qualité est contrdlée par le rapport des absorbances a 260 et 280 nm ainsi que 
par une électrophorése en gel d’agarose. Ainsi, la concentration de la préparation d’ARN synthétique utilisée pour 
ces études est de 1,6 mg/ml, ce qui correspond a 2,1.10'5 copies/ml d’ARN. 


[0277] Des quantités décroissantes d’ARN synthétique ont été amplifiés par RT-PCR a l’aide du kit "Superscript™ 
One-Step RT-PCR with Platinum® Taq" et les couples d’amorces n° 1 (N/+/28507, N/-/28774) (figure 1A) et n° 2 (N/+/ 
28375, N//28702) (figure 1B), en suivant les indications du fournisseur. Les conditions d’amplification utilisées sont les 
suivantes : ’ADNc a été synthétisé par incubation 30 min a 45 °C, 15 min a 55°C puis 2 min a 94 °C puis il a été amplifié 
par 5 cycles comprenant : une étape de dénaturation a 94°C pendant 15 sec, une étape d’hybridation a 45°C pendant 
30 sec puis une étape d’élongation a 72°C pendant 30 sec, suivis de 35 cycles comprenant : une étape de dénaturation 
a 94°C pendant 15 sec, une étape d’hybridation a 55°C pendant 30 sec puis une étape d’élongation a 72°C pendant 30 
sec, avec 2 sec d’élongation supplémentaire a chaque cycle, et d’une étape finale d’élongation a 72°C pendant 5 min. 
Les produits d’amplification obtenus ont ensuite été maintenus a 10°C. 

[0278] Les résultats présentés a la figure 11 montrent que le couple d’amorces n° 2 (N/+/28375, N/-/28702) permet 
de détecter jusqu’a 10 copies d’ARN (bande de faible intensité) ou 102 copies (bande de bonne intensité) contre 104 
copies pour le couple d’amorces n° 1 (N/+/28507, N/-/28774). Les amplicons sont respectivement de 268 pb (couple 1) 
et de 328 pb (couple 2). 
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c) mise au point de la RT-PCR en temps réel 





[0279] UneRT-PCR en temps réel a été mise au point a l’aide du couple d’amorces n°2 et du couple de sonde constitué 
par SRAS/N/FL et SRAS/N/LC705 (figure 2). 

[0280] L’amplification a été réalisée sur un LightCycler™ (Roche) a l’aide du kit "Light Cycler RNA Amplification Kit 
Hybridization Probes " (référence 2 015 145, Roche) dans les conditions optimisées suivantes. Un Mélange réactionnel 
contenant : HO (6,8 wl), MgCl> 25 mM (0,8 wl, 4 uM final de Mg2+), mélange réactionnel 5X (4 wl), sonde SRAS/N/FL 
3 uM (0,5 pl, 0,075 iM final), sonde SRAS/N/LC705 3 pM (0,5 pl, 0,075 uM final), amorce N/+/28375 10 uM (1 wl, 0,5 
»M final), amorce N/-/28702 10 wM (1 wl, 0,5 uM final), mélange d’enzyme (0,4 wl) et échantillon (ARN viral, 5 wl) a été 
amplifié en suivant le programme suivant : 


- Transcription inverse : 50°C 10:00min analysis mode: none 
- Dénaturation : 95°C 30sec x1 analysis mode: none 
- Amplification : 95°C 2sec } 
50°C . 15sec analysis mode: quantification*} x45 
72°C 13sec rampe thermique 2,0°C/sec } 
-  refroidissement : 40°C 30sec x1 analysis mode: none 


*La mesure de fluorescence se fait a la fin de I’hybridation et a chaque cycle (en mode SINGLE). 

[0281] Les résultats présentés a la figure 12 montrent que cette RT-PCR en temps réel est trés sensible puisqu’elle 
permet de détecter 102 copies d’ARN synthétique dans 100% des 5 échantillons analysés (29/29 échantillons dans 8 
expériences) etjusqu’a 10 copies d’ARN dans 100% des 5 échantillons analysés (40/45 échantillons dans 8 expériences). 
Elle montre également que cette RT-PCR permet de détecter la presence du genome du SARS-CoV dans un échantillon 
et de quantifier le nombre de génomes présents. A titre d’exemple, l’ARN viral d’un stock de SARS-CoV cultivé sur 
cellules Vero E6 a été extrait a l'aide du kit "Qiamp viral RNA extraction" (Qiagen), dilué 4 0,05.10~ et analysé par RT- 
PCR en temps réel selon le protocole décrit ci-dessus; l’analyse présentée a la figure 12 montre que ce stock de virus 
contient 6,5.109 génomes -équivalents/ml (geq/ml), ce qui est tout a fait similaire a la valeur de 1,0.1019 geq/ml mesurée 
a l'aide du kit "RealArt™ HPA-Coronavirus LC RT PCR Reagents" commercialisé par Artus. 


2) Mise au point de conditions de RT-PCR nichée ciblant le gene de l’ARN polymérase - test "RT-PCR nichée 
CDC (Centers for Disease Control and Prevention) /IP" 


a) Extraction de l’ARN viral 


[0282] Echantillon clinique : QlAamp viral RNA Mini Kit (QIAGEN) selon les indications du fabricant, ou une technique 
équivalente. L’'ARN est élué dans un volume de 60 ul. 


b) RT-PCR nichée "SNE/SAR" 





Premiére étape : RT-PCR couplée « SNE » 


[0283] Le kit Invitrogen "Superscript™ One-Step RT-PCR with Platinum® Taq'a été utilisé, mais le kit "Titan" de 
Roche Boehringer peut lui étre substitué avec des résultats similaires. 


Oligonucléotides : 
[0284] 


- SNE-S1 5’ GGT TGG GAT TAT CCA AAA TGT GA 3’ 
- SNE-AS1 5’GCA TCA TCA GAA AGA ATC ATC ATG 3’ 


-> Taille attendue :440 pb 
1. Préparer un mix : 


H20 6,5 pl 
Reaction mix 2X 12,5 pl 
Oligo SNE-S1 50 pM O72 pl 
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(suite) 
Oligo SNE-AS150pM 0,2 pl 
RNAsin 40 U/yl 0,12 wl 


RT/Platinum Taq mix 0,54 


2. A 20 wl du mix, ajouter 5 wl d’ARN et procéder a l’amplification sur thermocycleur (conditions ABI 9600) : 


2.1 45°C 30 min. 


55°C = 15 min. 
94°C =. 2 min. 
2.2. 94°C 15sec. } 
45°C 30sec. }x 5 cycles 
72°C ~—- 30 sec. } 
2.3. 94°C 15sec. } 
55°C = 30 sec. }x 35 cycles 


72°C = 30sec. + 2sec./cycle } 
2.4. 72°C  5min. 
2.5 10°C = & 


Conservation a +4°C. 

[0285] La RNAsin (N2511/N2515) de Promega a été utilisée comme inhibiteurs de RNase. 

[0286] Des ARN synthétiques ont servi de témoin positif. A titre de contrdle, 10%, 102 et 10 copies d’ARN synthétique 
Rsne ont été amplifices dans chaque expérience. 

Seconde étape : PCR nichée "SAR" 

Oligonucléotides : 


[0287] 


- SAR1-S 5’ CCT CTC TTG TTC TTG CTC GCA 3’ 
- SAR1-AS 5’ TAT AGT GAG CCG CCA CAC ATG 3’ 


-> Taille attendue : 121 pb 
1. Préparer un mix : 


H20 35,8 pl 
Tampon Tag 10X 5 pl 
MgCl, 25 mM 4ul 
Mix dNTPs 5 mM 2 pl 


Oligo SAR1-S 50 pM 0,5 pl 
Oligo SAR1-AS 50 pM 0,5 pl 
Taq ADN pol 5 U/l 0,25 pl 


L’AmpliTaq DNA Pol d’Applied Biosystems a été utilisée (tampon 10X sans MgClo, réf 27216601). 
2. A 48 wl du mix, ajouter 2 wl du produit de la premiére PCR et procéder a l’amplification (conditions ABI 9600) : 


2.1. 94°C 9 2min. 


2.2. 94°C 30sec. } 
45°C 45sec. }x 5 cycles 
72°C ~—- 30 sec. } 

2.3. 94°C 30sec. } 
55°C ~—- 30 sec. }x 35 cycles 
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(suite) 


72°C = 30sec. + 1sec./cycle } 
2.4. 72°C  5min. 
2.5 10°C = & 


3. Analyser 10 wl du produit réactionnel sur gel "/ow-melting" (type Seakem GTG) a 3% d’agarose. 

La sensibilité du test niché est en routine, dans les conditions décrites, de 10 copies d’ARN. 

4. Les fragments peuvent ensuite étre purifiés sur QlIAquick PCR kilt (QIAGEN) et séquencés avec les oligos SAR1-S 
et SAR1-AS. 


3) Détection de l’ ARN du SARS-CoV par PCR a partir de prélevements respiratoires 


a) Premiére étude comparative 





[0288] Une étude comparative a été réalisée sur une série de prélevements respiratoires recus par le Centre National 
de Référence du Virus Influenzae (région nord) et susceptibles de contenir du SARS-CoV. Pour ce faire, ’ARN a été 
extrait des prélevements a l’aide du kit "Qiamp viral RNA extraction" (Qiagen) et analysé par RT-PCR en temps réel, 
d’une part a l'aide des couples d’amorces et de sondes de la série n° 2 dans les conditions décrites ci-dessus d’une 
part, et d’autre part a l'aide du kit "LightCycler SARS-CoV quantification kit" commercialisé par Roche (référence 03 604 
438). Les résultats sont resumés dans le Tableau VI ci-dessous. Ils montrent que 18 des 26 prélévements sont négatifs 
et 5 des 26 prélévements sont positifs pour les deux kits, tandis qu’un prélévement est positif pour le seul kit Roche et 
deux pour les seuls réactifs N "série2". En outre, pour 3 prélevements (20032701, 20032712, 20032714) les quantités 
d’ARN détectés sont nettement supérieures avec les réactifs (sondes et amorces) de la série n°2. Ces résultats indiquent 
que les amorces et sondes N "série2" sont plus sensibles pour la détection du genome du SARS-CoV dans des prélé- 
vements biologiques que celles du kit actuellement disponible. 


Tableau VI: Analyse par RT-PCR en temps réel des ARN extraits d’une série de prélevements de 5 patients 

a l’aide des couples d’amorces et de sondes de la série n° 2 (N "série 2") ou du kit "LightCycler SARS-CoV 

quantification kit" (Roche). Le type de prélevement est indiqué ainsi que le nombre de copies de genome 
viral mesurées dans chacun des deux tests. NEG : RT-PCR négative. 


























Prélevements n° Patient Type de KIT ROCHE N "série2" 
prélevement 

20033082 K nasal NEG NEG 
20033083 K pharyngé NEG NEG 
20033086 K nasal NEG NEG 
20033087 K pharyngé NEG NEG 
20032802 M nasal NEG NEG 
20032803 M expectoration NEG NEG 
20032806 M nasal ou pharyngé NEG NEG 

20031746ARN2 Cc pharyngé NEG NEG 
20032711 Cc nasal ou pharyngé 39 NEG 
20032910 B nasal NEG NEG 
20032911 B pharyngé NEG NEG 
20033356 V expectoration NEG NEG 
20033357 V expectoration NEG NEG 
20031725 K asp. endotrachéale NEG 150 
20032657 K asp. endotrachéale NEG NEG 
20032698 K asp. endotrachéale NEG NEG 
20032720 K asp. endotrachéale 3 5 
20033074 K selles 115 257 
20032701 M pharyngé 443 1676 
20032702 M expectoration NEG 249 

20031747ARN2 Cc pharyngé NEG NEG 
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(suite) 
Prélevements n° Patient Type de KIT ROCHE N "série2" 
prélevement 
20032712 Cc inconnu 634 6914 
20032714 Cc pharyngé 17 223 
20032800 B nasal NEG NEG 
20033353 V nasal NEG NEG 
20033384 V nasal NEG NEG 























b) Deuxiéme étude comparative 





[0289] Les performances de différentes méthodes de RT-PCR nichée et de RT-PCR en temps réel ont ensuite été 
comparées pour 121 prélévements respiratoires de cas possibles de SRAS de I’hépital frangais de Hanoi, Vietnam, 
réalisés entre le 4&me et le 17&™e jour aprés le début des symptémes. Parmi ces prélévements, 14 avaient été trouvés 
positifs lors d’un premier test utilisant la méthode de RT-PCR nichée ciblant lORFlb (codant pour la réplicase) telle que 
décrite initialement par le Bernhard Nocht Institute (RT-PCR nichée BNI). Des informations concernant ce test sont 
disponibles sur internet, a l'adresse http://wwwl5.bni-hamburg.de/bnilbn12/neu2/getfile.acgi?area_engl=diagnos- 


tics&pid=4112. 
[0290] Les différents tests comparés dans cette étude sont : 





- la méthode de RT-PCR quantitative selon l’invention, avec les amorces et sonde N "série 2" décrite ci-dessus 
(colonne Light Cycler N), 

- le test de RT-PCR nichée ciblant le géne de l’ARN polymérase décrit ci-dessus, développé par le CDC, le BNI et 
l'Institut Pasteur (RT-PCR nichée CDC/IP), 

- le kit ARTUS de référence "HPA Corona LC RT-PCR Kit # 5601-02", qui est un test de RT-PCR en temps réel 
ciblant le gene ORF 1b, 

- le test de RT-PCR nichée du BNI, ciblant également le géne de l’'ARN polymérase, mentionné ci-dessus. 


[0291] Les inventeurs ont constateé : 


1) une variabilité inter-test pour une méme technique, liée a la dégradation de la préparation d’ARN lors de décon- 
gélations répétées, notamment pour les échantillons contenant les quantités d’ARN les plus faibles, 

2) une sensibilité réeduite de la RT-PCR nichée CDC/IP par rapport a la RT-PCR nichée BNI, et 

3) une sensibilité comparable du test de RT-PCR quantitative selon l’invention (Light Cycler N) par rapport au test 
Light Cycler (LC) Artus. 


[0292] Ces résultats, présentés dans le Tableau VII ci-dessous, montrent que le test par RT-PCR quantitative selon 
invention constitue un excellent complément - ou une alternative - aux tests actuellement disponibles. En effet, le 
coronavirus lié au SRAS est un virus €mergent, susceptible d’évoluer rapidement. En particulier, le gene de la RNA 
polymérase du coronavirus lié au SRAS, qui est ciblé dans la plupart des tests actuellement disponibles, peut recombiner 
avec celui d’autres coronavirus non liés au SRAS. L’utilisation d’un test ciblant exclusivement ce géne pourrait alors 
conduire a l’obtention de faux négatifs. 

[0293] Le test par RT-PCR quantitative selon l’invention ne cible pas la méme région génomique que le kit ARTUS, 
puisqu’il cible le géne codant pour la protéine N. En réalisant un test de diagnostique ciblant deux génes différents du 
coronavirus lié au SRAS, on peut donc espérer s’affranchir de résultats de type faux négatifs, qui pourraient étre dus a 
’évolution génétique du virus. 

[0294] De plus, il apparait particulierement avantageux de cibler le géne de la protéine de nucléocapside, car il est 
trés stable, du fait de la forte pression de sélection liée aux contraintes structurales élevées concernant cette protéine. 
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Tableau VII: Comparaison de différentes méthodes d’analyse par amplification génique, a partir de 121 
Prélévements de cas probables de SRAS de I’h6pital frangais de Hanoi, Vietnam (épidémie 2003) 



















































































N° CNR Type Jour Patient RT-PCR | RT-PCR kit Light Light 
prelévement | prélevement nichée nichée Cycler Cycler N 
(1) CDCI/IP BNI Artus (IP) 
107 NetP Négatif Négatif Négatif Négatif 
prélévements 
032529 P 10 NHB Négatif Positif Négatif Négatif 
032530 N 10 NHB Positif Positif 3,10E+01 4,20E+01 
032531 P 7 LP Positif Positif 7,70E+00 3,10E+00 
032534 N 15 BND Positif Positif 1,60E+00 Négatif 
032600 P 4 NHH Négatif Positif Négatif 1,30E+02 
032612 P 17 NTS Négatif Positif Négatif Négatif 
032688 P 9 BTX Positif Positif Négatif Négatif 
032689 N 4 NVH Positif Positif 1,20E+01 2,30E+02 
032690 P 4 NVH Négatif Positif 1,60E+00 Négatif 
032727 P 8 NVH Positif Positif 2,30E+02 4.00E+02 
032728 N 8 NVH Positif Positif 1,10E+03 1,60E+04 
032729 P 14 NHB Positif Positif 5,90E+00 3,40E+01 
032730 N 14 NHB Positif Positif 1,30E+02 4,80E+02 
032741 P 8 NHH Positif Positif 2,10E+02 1,30E+02 
positifs 10 14 10 9 
fraction détectée des 14 positifs 71,4% 100,0% 71,4% 64,3% 
(1) P= écouvillonage pharyngé 
N= écouvillonage nasal 











Exemple 9 : Obtention et caractérisation d’anticorps monoclonaux dirigés contre la protéine N 


[0295] Dessouris Balb C ont été immunisées a l’aide de la protéine N recombinante purifiée et leurs cellules spléniques 
fusionnées avec un myélome murin approprié selon les techniques de Kohler et Milstein. 

[0296] Dix-neufhybridomes sécréteurs d’anticorps anti N ont été présélectionnés et leurs immuno réactivités précisées. 
Ces anticorps reconnaissent bien la protéine N recombinante (en ELISA) avec des intensités variables, ainsi que la 
protéine virale, naturelle N en ELISA et/ou en Western Blot. Les figures 18 a 20 montrent les résultats de ces tests pour 
15 de ces 19 anticorps monoclonaux. 

[0297] Les clones 12, 17, 28, 57, 72, 76, 86, 87, 98, 103, 146, 156, 166, 170, 199, 212, 218, 219 et 222, fortement 
réactifs, ont été sous clonés. Les études de spécificité ont été poursuivies avec les outils appropriés afin de préciser les 
épitopes reconnus et verifier l’absence de réactivité vis-a-vis des autres Coronavirus humains et de certains virus 
respiratoires. 

[0298] Les études de cartographie (mapping) épitopique (réalisées sur membrane spot, a l’aide de peptides chevau- 
chants de 15 aa) et les études supplémentaires réalisées sur la protéine N naturelle en Western Blot ont révélé l’existence 
de 4 groupes d’anticorps monoclonaux : 


1° Anticorps monoclonaux spécifiques d’un épitope linéaire majeur en position N-ter (75-81, sequence : INTNSVP) 
Le représentant de ce groupe est l’anticorps 156. L’hybridome produisant cet anticorps a été déposé a la Collection 
Nationale de Cultures de Microorganismes (CNCM) de I’Institut Patseur (Paris, France) le 1°" décembre 2004, sous 
le numéro I-3331. Ce méme épitope est également reconnu par un sérum de lapin (polyclonal anti N) obtenu par 
immunisation classique a l’aide de cette méme protéine N. 
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2° Anticorps monoclonaux spécifiques d’un épitope linéaire majeur situé en position centrale (position 217-224, 
séquence : ETALALL); les représentants de ce groupe sont les anticorps monoclonaux 87 et 166. L’hybridome 
produisant l’anticorps 87 a été déposé a la CNCM le 1° décembre 2004, sous le numéro I-3328. 

3° Anticorps monoclonaux spécifiques d’un épitope linéaire majeur situé en position C-terminale (position 403-408, 
séquence : DFFRQL), les représentants de ce groupe sont les anticorps 28, 57 et 143. L’hybridome produisant 
l'anticorps 57 a été déposé a la CNCM le 1& décembre 2004, sous le numéro |-3330. 

4° Anticorps monoclonaux spécifiques d’un épitope discontinu, conformationel. Ce groupe d’anticorps ne reconnait 
aucun des peptides recouvrant la séquence de la protéine N, mais réagissent fortement sur la protéine naturelle 
non dénaturée. Le représentant de ce dernier groupe est l’anticorps 86. L’hybridome produisant cet anticorps a été 
déposé a la CNCM le 1€° décembre 2004, sous le numéro I-3329. 


[0299] Le Tableau VIII ci-aprés résume les résultats de cartographie épitopique obtenus : 


Tableau VIII : Mapping épitopique des anticorps monoclonaux 









































Anticorps Epitope Position Région 
28 DFSRQL Q 403 ...408 | C-Ter. 
143 DFSRQL Q 
76 DFSRQL Q 
57 DFSRQL Q 

FFGMS RI 315 .... 319 
146 LPQRQ 383...387 
166 ETALALLLL 217 ...224 centrale 
87 ETALALL 217... 224 
156 INTNSGP 75... 81 N - Ter. 
86 Conformationnel 
212 Conformationel 
170 Conformationnel 




















[0300] En outre, comme illustré notamment aux figures 18 et 19, ces anticorps ne présentent pas de réactivité en 
ELISA et/ou en WB, vis a vis de la protéine N du coronavirus humain 229 E. 


Exemple 10 : Combinaisons des anticorps monoclonaux pour le développement d’un test d’immunocapture 
sensible et spécifique de l’antigéne viral N dans le sérum ou les fluides biologiques des patients contaminés 
par le virus SARS Co V 


[0301] Les anticorps listés ci-dessous ont été retenus en raison de leurs propriétés bien particuliéres pour une étude 
supplémentaire de capture et détection de la protéine virale N, dans le sérum des sujets ou patients. 

[0302] Ces anticorps ont été produits en ascite sur souris, purifiés par chromatographie d’affinité et utilisés seuls ou 
en combinaison comme anticorps de capture, et comme anticorps signal. 

[0303] Liste des anticorps sélectionnés pour le propos : 


- Acm anti région C-ter (n° 28, 57, 143) 

- Acm anti région centrale (n° 87, 166) 

- Acm anti région N-ter (n° 156) 

- Acm anti épitope discontinu, conformationnel (86) 


1) Préparation des réactifs : 


a) Plaques ELISA immunocapture 





[0304] Les plaques sont sensibilisées avec les solutions d’anticorps a 5 g/ml en tampon carbonate 0,1 M, pH.9,6. 
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Les solutions (monovalentes ou plurivalentes) sont déposées sous volume de 100 yl dans les puits et incubées pendant 
une nuit a température ambiante. Ces plaques sont ensuite lavées en tampon PBS (10 mM pH 7,4 additionné de 0,1% 
de Tween 20) puis saturées avec une solution de PBS additionnée de 0,3% de BSA et de 5% de Saccharose). Les 
plaques sont ensuite séchées puis conditionnées dans un sachet en présence d’un dessicant. Elles sont prétes al’emploi. 


b) Conjugués 


[0305] Les anticorps purifiés ont été couplés a la péroxydase selon le protocole de Nakane (Nakane et al. - 1974, J.of 
Histo and cytochemistry, vol.22, p1084-1091) dans un rapport de une molécule d’lgG pour 3 molécules de péroxydase. 
Ces conjugués ont été purifiés par chromatographie d’exclusion et conservés concentrés (concentration comprise entre 
1 a2 mg/ml) en présence de 50% de glycerol et a -20°C. Ils sont dilués pour leur mise en oeuvre dans les essais a la 
concentration finale de 1 ou 2 wg/ml en tampon PBS (pH 7,4) additionné de 1% de BSA. 


c) Autres réactifs 
[0306] 


- Sérums humains négatifs pour tous les marqueurs sériques des virus HIV, HBV, HCV et THLV 

- Pool de sérums humains négatifs additionné de 0,5% de Triton X 100 

- Ag viral inactivé : surnageant de culture virale inactivé par irradiation et inactivation vérifiée aprés mise en culture 
sur cellules sensibles - titre de la suspension avant inactivation environ 10’ particules infectieuses par ml ou encore 
environ 5x109 particules virales physiques par ml d’antigéne 

- Les échantillons d’Ag dilués en sérum humain négatif : ces échantillons ont été préparés par dilution au 1:100® puis 
par dilution en série de raison 5. 
Ces échantillons non infectieux miment des échantillons humains supposés contenir des concentrations faibles a 
trés faibles de nucléoprotéine virale N. De tels échantillons ne sont pas accessibles pour les travaux de routine 

- Solution de lavage R2, solution de révélation TMB R8, chromogéne R¢9 et solution d’arrét R10, sont les réactifs 
génériques commercialisés par Bio-Rad dans ses trousses ELISA (ex : trousse Platelia Pylori ref.72778). 


2) Mode opératoire 


[0307] Les échantillons de sérums humains surchargés en Ag viral inactivé sont distribués a raison de 100 wl par 
cupule, directement dans les plaques sensibilisées, prétes a l’emploi puis incubés pendant 1 heure a 37°C (incubation 
Bio-Rad IPS). 

[0308] Le matériel non retenu par la phase solide est éliminé par 3 lavages (lavage avec solution R2 diluée, laveur 
automatique LP 35). 

[0309] Les conjugués appropriés, dilués a la concentration finale de 1 ou 2 wg/ml sont distribués a raison de 100 wl 
par cupule et les plaques incubées a nouveau pendant une heure a 37° C (incubation IPS). 

[0310] L’excés de conjugué est éliminé par 4 lavages successifs (solution R2 diluée - laveur LP 35). 

[0311] La présence de conjugué fixé sur les plaques est révélée aprés addition de 100 pl de solution de révélation 
préparée avant emploi (1 ml de R9 et 10 ml de R8) et aprés incubation pendant 30 minutes, a température ambiante et 
a l'abri de la lumiére. 

[0312] Laréaction enzymatique est finalement bloquée par addition de 100 wl de réactif R10 (H2SO04 IN) dans toutes 
les cupules. 

[0313] Lalecture est effectuée a l'aide d’un lecteur de microplaque approprié a double longueur d’onde (450/620 nm). 
[0314] Les résultats peuvent étre interprétés en utilisant comme valeur seuil provisoire la moyenne d’au moins deux 
contréles négatifs multiplié par un facteur 2 ou encore la moyenne de 100 sérums négatifs additionnée d’un incrément 
correspondant a 6 SD (Standart Deviation calculée sur les 100 mesures individuelles). 


3) Résultats 

[0315] Différentes combinaisons anticorps de capture et anticorps signal ont été testées en se fondant sur les propriétés 
des anticorps sélectionnés, et en évitant les combinaisons d’anticorps spécifiques des mémes €pitopes en phase solide 
et en conjugués. 

[0316] Les meilleurs résultats ont été obtenus avec les 4 combinaisons listées ci-dessous. Ces résultats sont reproduits 


dans le tableau IX ci-aprés. 


1. Combinaison F/28 
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Phase solide (Acm 166 + 87 région centrale) : conjugué anticorps 28 (C-ter) 

2. Combinaison G/28 

Phase solide (Acm 86 - épitope conformationel) : conjugué anticorps 28 (C-ter) 

3. Combinaison H/28 

Phase solide (Acms 86, 166 et 87 région centrale et épitope conformationel) : conjugué anticorps 28 (C-ter) 

4. Combinaison H/28 + 87 

Phase solide (Acms 86, 166 et 87 région centrale et Epitope conformationel) : conjugué mixte anticorps 28 (C-ter) 
et 87 (central) 

5. Combinaison G/87 

Phase solide (Acm 86 - épitope conformationel) : conjugué anticorps 87 (région centrale) 

Les 4 premiéres combinaisons présentent des performances équivalentes et reproduites, supérieures aux autres 
combinaisons mises en oeuvre (comme par exemple la combinaison G/87). Bien entendu, dans ces combinaisons, 
un anticorps monoclonal peut étre remplacé par un autre anticorps reconnaissant le méme é€pitope. Ainsi, on peut 
citer les variantes suivantes : 

6. Variante de la combinaison F/28 

Phase solide (Acm 87 uniquement) : conjugué anticorps 57 (C-ter) 

7. Variante de la combinaison G/28 

Phase solide (Acm 86 - épitope conformationel) : conjugué anticorps 57 (C-ter) 

8. Variante de la combinaison H/28 

Phase solide (Acms 86 et 87 région centrale et Epitope conformationel) : conjugué anticorps 57 (C-ter) 

9. Variante de la combinaison H/28 + 87 

Phase solide (Acms 86 et 87 région centrale et épitope conformationel) : conjugué mixte anticorps 57 (C-ter) et 87 
(central) 


Tableau IX : Contréle d’immunoréactivité des Acm anti nucléoprotéines SARS CoV : densités optiques mesurées 
avec chaque combinaison d’anticorps, en fonction des dilutions de l’antigéne viral inactivé. 





























N° Dilution F/28 G/28 G/87 H/28 H/28+87 
0 1/100 5 5 3,495 3,900 5 

1 1/500 3, 795 3,814 1,379 3,702 3,804 
2 Y2 500 2,815 2,950 0,275 3,268 2,680 
3 1/12500 0,987 1,038 0,135 1,374 0,865 
4 1/62500 0,404 0,348 0,125 0,480 0,328 
5 1/312500 0,285 0,211 0,123 0,240 0,215 
6 Témoin 0,210 0,200 0,098 0,186 0,156 
7 Témoin 0,269 0,153 0,104 0,193 0,202 








[0317] La limite de détection de ces 4 essais expérimentaux correspond a la dilution d’antigene en sérum négatif 1: 
62500. Une extrapolation rapide laisse supposer la détection de moins de 10° particules infectieuses par ml de sérums. 
[0318] De cette étude, il ressort que les anticorps les mieux appropriés pour la capture de la nucleoprotéine virale 
native sont les anticorps spécifiques de la région centrale et/ou d’un épitope conformationnel, l’un et l'autre étant des 
anticorps sélectionnés également pour leur forte affinité pour l’antigéne natif. 

[0319] Ayantdéterminé les meilleurs anticorps pour la composition de la phase solide, les anticorps a retenir en priorité 
pour la détection des antigénes fixés sur la phase solide, sont les anticorps complémentaires spécifiques d’un épitope 
dominant en région C-ter. L’emploi de tout autre anticorps complémentaire, mais spécifique des épitopes localisés en 
région N-ter de la protéine conduit a des résultats moyens ou médiocres. 


Exemple 11 : Systemes d’expression eucaryotes de la proteine de spicule (S) du coronavirus associé au SRAS 
(SRAS-CoV) 


1) Optimisation des conditions d’expression de la S du SRAS-CoV en cellules de mammiféres. 
[0320] _Lesconditions d’expression transitoire de la protéine de spicule (S) du SRAS- CoV ont été optimisées en cellules 


de mammiféres (293T, VeroE6). 
[0321] Pour cela, un fragment d’ADN contenant le cDNA de la S du SRAS-CoV a été amplifié par PCR a l'aide des 
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oligonucléotides 5-ATAGGATCCA CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3’ et 5-ATACTCGAGTT AT- 
GTGTAATG TAATTTGACA CCCTTG-3’ a partir du plasmide pSARS-S (C.N.C.M. n° I-3059) puis inséré entre les sites 
BamH’1 et Xho1 du plasmide pTRIPAU3-CMV contenant un vecteur lentiviral TRIP (Sirven, 2001, Mol. Ther., 3, 438-448) 
pour obtenir le plasmide pTRIP-S. Le fragment BamH1 et Xho1 contenant le cDNA de la S a ensuite été sous-cloné 
entre les BamH1 et Xho1 du plasmide d’expression eucaryote pcDNA3.1(+) (Clontech) pour obtenir le plasmide pcDNA- 
S. Le fragment Nhe1 et Xho1 contenant le cADN de la S a ensuite été sous-cloné entre les sites correspondants du 
plasmide d’expression pCl (Promega) pour obtenir le plasmide pCI-S. Les sequences WPRE du virus de I’hépatite de 
la marmotte ("Woodchuck Hepatitis Virus posttranscriptional regulatory element’) et les sequences CTE ("constitutive 
transport element’) du rétrovirus simien de Mason-Pfizer ont été insérées dans chacun des deux plasmides pcDNA-S 
et pCI-S entre les sites Xho1 et Xba1 pour obtenir respectivement les plasmides pcDNA-S-CTE, pcDNA-S-WPRE, pCl- 
S-CTE et pCl-S-WPRE (figure 21). Le plasmide pCI-S-WPRE a été déposé a la CNCM, le 22 novembre 2004, sous le 
numéro |-3323. Tous les inserts ont été séquencés a l'aide d’un kit BigDye Terminator v1.1 (Applied Biosystems) et 
d’un séquenceur automatique ABI377. 

[0322] Lacapacité des plasmides construits a diriger l’expression de la S du SRAS-CoV dans des cellules de mam- 
miféres a été recherchée aprés transfection de cellules VeroE6 (figure 22). Dans cette expérience, des monocouches 
de 5x105 cellules VeroE6 en boites de Pétri de 35mm ont été transfectées avec 2 wg des plasmides pcDNA (a titre de 
contréle), pcDNA-S, pCl et pCl-S et 6 wl de réactif Fugene6 selon les indications du fabricant (Roche). Aprés 48 heures 
d’incubation a 37°C et sous 5% de COs, des extraits cellulaires ont été préparé en tampon de dépdt selon Laemmli, 
séparés sur un gel SDS a 8% de polyacrylamide, puis transférés sur une membrane de PVDF (BioRad). La détection 
de cette immunoempreinte (« western blot ») a été réalisée a l'aide d’un sérum polyclonal de lapin anti-S (immun-sérum 
du lapin P11135 : cf exemple 4 ci-dessus) et d’anticorps polyclonaux d’ane dirigés contre les IgG de lapin et couplés a 
la peroxidase (NA934V, Amersham). Les anticorps fixés ont été révélés par luminescence a l’aide du kit ECL+ (Amers- 
ham) et de films d’autoradiographie Hyperfilm MP (Amersham). 

[0323] Cette expérience (figure 22) montre que le plasmide pcDNA-S ne permet pas de diriger l’expression de la S 
du SRAS-CoV a des niveaux détectables tandis que le plasmide pCI-S permet une expression faible, proche de la limite 
de détection, qui peut étre mise en évidence lorsque le film est surexposé. Des résultats similaires ont été obtenus 
lorsque l’expression de la S a été recherchée par immunofluorescence (données non montrées). Cette impossibilité de 
détecter une expression efficace de la S ne peut pas étre imputée aux techniques de détection utilisées puisque la 
protéine S peut étre mise en évidence a la taille attendue (180 kDa) dans un extrait de cellules infectées par le SRAS- 
CoV ou dans un extrait de cellules VeroE6 infectées par le virus recombinant de la vaccine VV-TF7.3 et transfectées 
par le plasmide pcDNA-S. Dans cette derniére expérience, le virus VV-TF7.3 exprime l’ARN polymérase du phage T7 
et permet la transcription cytoplasmique d’un ARN non coiffé susceptible d’étre traduit efficacement. Cette expérience 
suggére que les défauts d’expression décrits ci-dessus sont dus a une incapacité intrinséque du cADN de la S a étre 
exprimé efficacement lorsque I’étape de transcription en ARN messager est réalisée au niveau nucléaire. 

[0324] Dans une seconde expérience, l’effet des signaux CTE et WPRE sur l’expression de la S a été recherchée 
aprés transfection de cellules VeroE6 (figure 23A) et 293T (figure 23B) et selon un protocole similaire a celui décrit ci- 
dessus. Alors que l’expression de la S ne peut pas étre mis en évidence aprés transfection des plasmides pcDNA-S- 
CTE et pcDNA-S-WPRE dérivés de pcDNA-S, l’insertion des signaux WPRE et CTE améliore fortement l’expression 
de la S dans le contexte du plasmide d’expression pCI-S. 

[0325] Pour préciser ce résultat, une deuxiéme série d’expériences a été réalisée, ou l’immunoempreinte est révélée 
de fagon quantitative par luminescence et acquisition sur un dispositif d’imagerie numérique (FluorS, BioRad). L’analyse 
des résultats obtenus avec le logiciel QuantityOne v4.2.3 (BioRad) montre que les séquences WPRE et CTE augmentent 
respectivement l’expression de la S d’un facteur 20 a 42 et 10 a 26 en cellules Vero E6 (Tableau X). En cellules 293T 
(Tableau X), l’effet de la séquence CTE est plus modéré (4 a 5 fois) tandis que celui de la séquence WPRE reste 
important (13 a 28 fois). 
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Tableau X analyse quantitative de l’effet des signaux CTE et WPRE sur l’expression de la S du SRAS-CovV : 
Des extraits cellulaires ont été préparés 48 heures aprés transfection de cellulesVeroE6 ou 293T par les plasmides 
pCl, pCI-S, pCl-S-CTE et pCl-S-WPRE et analysés par western blot comme décrit dans la légende de la figure 22. 
Le western blot est révélé par luminescence (ECL+, Amersham) et acquisition sur un dispositif d’imagerie numérique 
(FluorS, BioRad). Les niveaux d’expression sont indiqués en fonction d’une échelle arbitraire ou la valeur de 1 
représente le niveau mesuré aprés transfection du plasmide pCI-S. Deux expériences indépendantes ont été réalisées 
pour chacun des deux types cellulaires. Dans l’expérience 1 sur cellules VeroE6, les transfections ont été réalisées 
en dupliqués et les résultats sont indiqués sous la forme de moyennes et écart-types des niveaux d’expression 





























mesurés. 
Plasmide Cellule exp. 1 exp. 2 
PCI VeroE6 0,0 0,0 
pCl-S VeroE6 1,.0+ 0,1 1,0 
pClI-S-CTE VeroE6 98+0,9 26,4 
pCl-S-WPRE VeroE6 20,1 + 2,0 42,3 
PCI 293T 0,0 0,0 
PCI-S 293T 1,0 1,0 
PCI-S-CTE 293T 4,6 4,0 
PCI-S-WPRE 293T 27,6 12,8 




















[0326] En résumé, l'ensemble de ces résultats montre que l’expression dans des cellules de mammiféres du cADN 
delaS du SRAS-CoV sous la dépendance de séquences promotrices de |’ ARN polymérase II, requiert, pour étre efficace, 
la présence d’un signal d’épissage ainsi que de l'une ou l’autre des sequences WPRE et CTE. 


2) Obtention de lignées stables permettant l’expression de la S du SRAS-CoV 


[0327] LecADN dela protéine S du SRAS-CoV a été cloné sous la forme d’un fragment BamH1-Xho1 dans le plasmide 
pTRIPAU3-CMV contenant un vecteur lentiviral défectif TRIP a DNA flap central (Sirven et al, 2001, Mol. Ther., 3: 
438-448) pour obtenir le plasmide pTRIP-S (figure 24). La co-transfection transitoire selon Zennou et al (2000, Cell, 
101 : 173-185) de ce plasmide, d’un plasmide d’encapsidation (p8.2) et d’un plasmide d’expression de la glycoprotéine 
d’enveloppe G du VSV (pHCMV-G) dans des cellules 293T a permis la préparation de pseudoparticules rétrovirales 
contenant le vecteur TRIP -S et pseudotypées par la protéine d’enveloppe G. Ces vecteurs TRIP-S pseudotypés ont 
été utilisés pour transduire des cellules 293T et FRhK-4 : aucune expression de la protéine S n’a pu étre mis en évidence 
par western blot et immunofluorescence dans les cellules transduites (données non présentées). 

[0328] Les cassettes d’expression optimales constituées du promoteur immédiat/précoce du virus CMV, d’un signal 
d’épissage, du cDNA de la S et de I’un ou l’autre des signaux post-transcriptionnels WPRE ou CTE décrites ci-dessus 
ont alors été substituées a la cassette EF1a-EGFP du vecteur d’expression lentiviral défectif a DNA FLAP central 
TRIPAU3-EF 1 (Sirven et al, 2001, Mol. Ther., 3 :438-448) (figure 25). Ces substitutions ont été réalisées par une série 
de sous-clonages successifs des cassettes d’expression de S qui ont été excisées des plasmides pCT-S-CTE (Bg1Il- 
Apa'1) ou respectivement pCl-S-WPRE (Bglll-Sall) puis insérées entre les sites Mlu1 et Kpn1 ou respectivement Mlu1 
et Xho1 du plasmide TRIPAU3-EF1o pour obtenir les plasmides pTRIP-SD/SA-S-CTE et pTRIP-SD/SA-S-WPRE, dé- 
posés a la CNCM, le 1& décembre 2004, sous les numéros |-3336 et I-3334, respectivement. Des vecteurs pseudotypés 
ont été produits selon Zennou et al (2000, Cell, 101 : 173-185) et utilisés pour transduire des cellules 293T (10000 
cellules) et FRhK-4 (15000 cellules) selon une série de 5 cycles successifs de transduction avec une quantité de vecteur 
correspondant a 25 ng (TRIP-SD/SA-S-CTE) ou 22 ng TRIP-SD/SA-S-WPRE) de p24 par cycle. 

[0329] Les cellules transduites ont été clonées par dilution limite et une série de clones ont été analysés pour |’ex- 
pression dela S du SRAS-CoV qualitativement par immunofluorescence (données non montrées), puis quantitativement 
par western blot (figure 25) a l'aide d’un sérum polyclonal de lapin anti-S. Les résultats présentés dans la figure 25 
montrent que les clones 2 et 15 de cellules FrhK4-s-CTE transduites par TRIP-SD/SA-S-CTE et les clones 4, 9 et 12 
de cellules FRhK4-S-WPRE transduites par TRIP-SD/SA-S-WPRE permettent l’expression de la S du SRAS-CoV a 
des niveaux respectivement faibles et modérés si on les compare a ceux que l’on peut observer au cours de I’infection 
par le SRAS-CoV. 

[0330] Enrésumé, les vecteurs TRIP-SD/SA-S-CTE et TRIP-SD/SA-S-WPRE permettent|’obtention de clones stables 
de cellules FRhK-4 et de fagon similaire 293T exprimant la S du SRAS-CoV, alors que les essais réalisés avec le vecteur 
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"de base" TRIP-S sont restés infructueux, ce qui démontre la nécessité d’un signal d’épissage ainsi que de |’une, ou 
l'autre, des séquences CTE et WPRE pour lobtention de clones cellulaires stables exprimant la protéine S. 

[0331] Enoutre, ces modifications du vecteur TRIP (insertion d’un signal d’épissage et d’un signal post-transcriptionnel 
comme CTE et WPRE) pourraient s’avérer intéressantes pour améliorer l’expression d’autres cDNA que celui de la S. 


3) Obtention de lignées stables permettant l’expression d’une forme soluble de la S du SRAS-CoV. Purification de cet 
antigéne recombinant 


[0332] Un cDNA codant pour une forme soluble de la protéine S (Ssol) a été obtenu en fusionnant les sequences 
codant pour l’ectodomaine de la protéine (acides aminés 1 a 1193) a celles d’une étiquette (FLAG : DYKDDDDK) via 
un linker BspEl codant pour le dipeptide SG. Pratiquement, pour obtenir le plasmide pcDNA-Ssol, un fragment d’ADN 
codant pour l’ectodomaine de la S du SRAS-CoV a été amplifié par PCR a l’aide des oligonucléotides 5-ATAGGATCCA 
CCATGTTTAT TTTCTTATTA TTTCTTACTC TCACT-3’ et 5-ACCTCCGGAT TTAATATATT GCTCATATTT TCCCAA- 
3’ a partir du plasmide pcDNA-S, puis inséré entre les sites uniques BamH1 et BspEl uniques d’un plasmide d’expression 
eucaryote pcDNA3.1(+) (Clontech) modifié contenant entre ses sites BamH1 et Xho1 la séquence de I’étiquette FLAG : 


// GGATCC ...nnn... TCC GGA GAT TAT AAA GAT GAC GAC GAT AAA TAA 


BamH1 S G pb Y K D D OD DK ter 
CTCGAG // 
Xhol 


[0333] Les fragments Nhe1-Xho1 et BamH1-Xho1, contenant le cADN de la S, ont ensuite été excisés du plasmide 
pcDNA-Sso1, et sous-clonés entre les sites correspondants du plasmide pTRIP-SD/SA-S-CTE et du plasmide pTRIP- 
SD/SA-S-WPRE, respectivement, pour obtenir les plasmides pTRIP-SD/SA-Ssol-CTE et pTRIP-SD/SA-Ssol-WPRE, 
déposés a la CNCM, le 1° décembre 2004, sous les numéros I-3337 et I-3335, respectivement. 

[0334] Des vecteurs pseudotypés ont été produits selon Zennou et coll. (2000, Cell, 101 : 173-185) et utilisés pour 
transduire des cellules FRhK-4 (15000 cellules) selon une série de 5 cycles successifs de transduction (15000 cellules) 
avec une quantité de vecteur correspondant a 24 ng (TRIP-SD/SA-Ssol-CTE) ou 40 ng TRIP-SD/SA-Ssol-WPRE) de 
p24 par cycle. Les cellules transduites ont été clonées par dilution limite et une série de 16 clones transduits par TRIP- 
SD/SA-Ssol-CTE et de 15 clones par TRIP-SD/SA-Ssol-WPRE ont été analysés pour l’expression du polypeptide Ssol 
par western blot révélé par un anticorps monoclonal anti-FLAG (figure 26 et données non montrées), ainsi que par un 
ELISA-capture spécifique du polypeptide Ssol qui a été mis au point dans ce but (Tableau XI et données non montrées). 
Une partie du processus de sélection des meilleurs clones sécréteurs est montré dans la figure 26. L’ELISA-capture 
repose sur l'utilisation de phases solides recouvertes d’anticorps polyclonaux de lapins immunisés par du SRAS-CoV 
purifié et inactivé. Ces phases solides permettentla capture du polypeptide Ssol sécrété dans les surnageants cellulaires, 
dont la présence est ensuite révélée par une série d’étapes impliquant successsivement la fixation d’un anticorps 
monoclonal anti-FLAG (M2, SIGMA), d’anticorps biotinylés polyclonaux de lapin anti-lgG(H+L) de souris (Jackson) et 
d’un conjugué streptavidine-peroxidase (Amersham) puis l’addition de chromogéne et de substrat (TMB + H05, KPL). 


Tableau XI : analyse de I’expression de polypeptide Ssol par des lignées cellulaires transduites par les 
vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. La sécrétion du polypeptide Ssol a été 
recherchée dans le surnageant d’une série de clones cellulaires isolés aprés transduction de cellules FRhK-4 par 
les vecteurs lentiviraux TRIP-SD/SA-Ssol-WPRE et TRIP-SD/SA-Ssol-CTE. Les surnageants dilués au 1/50 ont été 
analysés par un test ELISA-capture spécifique de la S du SRAS-CoV. 























Vecteur Clone DO (450 nm) 
Témoin | - 0,031 
TRIP-SD/SA-Ssol-CTE | CTE2 0,547 
CTE3 0,668 
CTE9 0,171 
CTE12 0,208 
CTE13 0,133 
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(suite) 
Vecteur Clone DO (450 nm) 
TRIP-SD/SA-Ssol-WPRE | WPRE1 0,061 
WPRE10 0,134 


























[0335] La lignée cellulaire sécrétant les quantités les plus élevées de polypeptide Ssol dans le surnageant de culture 
est la lignée FRhK4-Ssol-CTE3. Elle a été soumise a une deuxiéme série de 5 cycles de transduction par le vecteur 
TRIP-SD/SA-Ssol-CTE dans des conditions similaires a celles décrites ci-dessus puis clonée. Le sous-clone sécrétant 
les quantités les plus élevés de Ssol a été sélectionné par une combinaison d’analyse par western blot et ELISA-capture : 
il s’agit du sous-clone FRhK4-Ssol-30, qui a été déposé a la CNCM, le 22 novembre 2004, sous le numéro I-3325. 
[0336] La lignée FRhK4-Ssol-30 permet la production et la purification en quantité du polypeptide recombinant Ssol. 
Dans une expérience type ot les conditions expérimentales de croissance, de production et de purification ont été 
optimisées, les cellules de la lignée FRhK4-Ssol-30 sont ensemencées en milieu de culture standard (DMEM sans 
pyruvate contenant 4.5g/I de glucose et supplémenté par 5% de SVF, 100 U/ml de pénicilline et 100 j.g/ml de strepto- 
mycine) sous la forme d’une monocouche sous-confluente (1 million de cellules pour chaque 100 cm? dans 20 ml de 
milieu). A confluence, le milieu standard est remplacé par le milieu de sécrétion ot la quantité de SVF est abaissée a 
0.5% et la quantité de milieu réduite 4 16 ml pour chaque 100 cm2. Le surnageant de culture est prélevé aprés 4 a 5 
jours d’incubation a 35°C et sous 5% de COs. Le polypeptide recombinant Ssol est purifié a partir du surnageant par 
l'enchainement d’étapes de filtration sur membrane de polyethersulfone (PES) de 0.1 4m, de concentration par ultra- 
filtration sur une membrane de PES de point de coupure 50kD, de chromatographie d’affinité sur matrice anti-FLAG 
avec élution par une solution de peptide FLAG (DYKDDDDk) a 100 g/ml en TBS (Tris 50mM pH 7.4, 150 mMNaCl) 
puis de chromatographie de gel filtration en TBS sur billes de sephadex G-75 (Pharmacia). La concentration du poly- 
peptide recombinant Ssol purifié a été déterminée par test micro-BCA (Pierce) puis ses caractéristiques biochimiques 
analysées. 

[0337] L’analyse par gel SDS a8 % d’acrylamide coloré au nitrate d’argent met en évidence un polypeptide majoritaire 
dont la masse moléculaire est d’environ 180kD et dont le degré de pureté peut étre évalué a 98% (figure 27A). Par 
spectrométrie de masse SELDI-TOF (Cyphergen), deux pics principaux sont mis en évidence : ils correspondent a des 
formes simplement, et doublement chargées d’un polypeptide majoritaire dont la masse moléculaire est ainsi déterminée 
a 182,6 + 3,7 kD (figures 27B et C). Aprés transfert sur membrane Prosorb et rincage en TFA 0,1%, l’extrémité N- 
terminale du polypeptide Ssol a été séquencée en phase liquide par dégradation d’Edman sur 5 résidus (ABI494, Applied 
Biosystems) et déterminée comme étant SDLDR (figure 27D). Ceci démontre que le peptide signal localisé a l’extrémité 
N-terminale de la protéine S du SRAS-CoV, composé des aa 1 a 13 (MFIFLLFLTLTSG) d’aprés une analyse réalisée 
avec le logiciel signalP v2.0 (Nielsen et al., 1997, Protein Engineering, 10 : 1-6), est clivé du polypeptide Ssol mature. 
Le polypeptide recombinant Ssol est donc constitué des acides aminés 14 a 1193 de la protéine S du SRAS-CoV 
fusionnés en C-terminal a une sequence SGDYKDDDDK contenant la séquence de |’étiquette FLAG (soulignée). L’écart 
entre la masse molaire théorique du polypeptide Ssol nu (132,0 kD) et la masse molaire réelle du polypeptide mature 
(182,6 kD) suggére que le polypeptide Ssol est glycosylé. 

[0338] Une préparation de polypeptide Ssol purifié et dont la concentration protéique a été déterminée par test micro- 
BCA, permet de réaliser une gamme étalon pour mesurer al’aide du test ELISA-capture décrit plus hautles concentrations 
de Ssol présent dans les surnageants de culture et de revisiter les caractéristiques des lignées sécrétrices. Selon ce 
test, la lignée FRnK4-Ssol-CT3 sécréte 4 a 6 g/ml de polypeptide Ssol tandis que la lignée FRhK4-Ssol-30 sécréte 9 
a 13 wg/ml de Ssol aprés 4 a 5 jours de culture a confluence. En outre, le schéma de purification présenté plus haut 
permet en routine de purifier de 1 a 2 mg de polypeptide Ssol par litre de surnageant de culture. 


Exemple 12 : Immunisation génique visant la proteine de spicule (S) du coronavirus associé au SRAS (SRAS- 
CoV) 


[0339] L’effet d’un signal d’épissage et des signaux post-transcriptionnels WPRE et CTE a été analysé aprés immu- 
nisation génique de souris BALB/c (figure 28). 

[0340] Pour cela, des souris BALB/c ont été immunisées a des intervalles de 4 semaines par injection dans le tibialis 
anterior d’une solution saline de 50 wg d’ADN plasmidique de pcDNA-S et pCI-S ainsi que, a titre de contrdle, par 50 
pg d’ADN plasmidique de pcDNA-N (dirigeant l’expression de la N du SRAS-CoV) ou de pCI-HA (dirigeant l’expression 
de la HA du virus grippal A/PR/8/34) et les sérums immuns collectés 3 semaines aprés la 2€me injection. La présence 
d’anticorps dirigés contre la S du SRAS-CoV a été recherchée par ELISA indirect en utilisant comme antigéne un lysat 
de cellules VeroE6 infectées par le SRAS-CoV et a titre de contrdle, un lysat de cellules VeroE6 non infectées. Les titres 
(Tl) en anticorps anti-SRAS-CoV sont calculés comme linverse de la dilution produisant une DO spécifique de 0,5 
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(difference entre DO mesurée sur lysat de cellules infectées et DO mesurée sur lysat de cellules non infectées) aprés 
révélation par un anticorps polyclonal anti-lgG de souris couplé a la peroxidase (NA931V, Amersham) et du TMB 
additionné de H2,O, (KPL) (figure 28A). 

[0341] Dans ces conditions, le plasmide d’expression pcDNA-S ne permet l’induction que de faibles titres d’anticorps 
dirigées contre la S du SRAS-CoV chez 3 souris sur 6 (LOG,,(TI)=1,9+0,6) alors que le plasmide pcDNA-N permet 
l'induction d’anticorps anti-N a des titres élevés (LOG ,9(TI)= 3,9+0,3) chez tous les animaux, et les plasmides contrdles 
(pCl, pCI-HA) n’entrainent aucun anticorps détectable (LOG,9(TI)<1,7). Le plasmide pCI-S muni d’un signal d’épissage 
permet l’induction d’anticorps a des titres élevés (LOG,,(TI)= 3,7+0,2), qui sont environ 60 fois supérieurs a ceux 
observés aprés injection du plasmide pcDNA-S (p<10°). 

[0342] Lefficacité des signaux post-transcriptionnels a été étudiée en réalisant une étude dose-réponse des titres en 
anticorps anti-S induits chez la souris BALB/c en fonction de la quantité d’ADN plasmidique utilisé comme immunogéne 
(2g, 10 wg et 50 wg). Cette étude (figure 28B) démontre que le signal post-transcriptionnel WPRE améliore fortement 
l'efficacité de l’immunisation génique lorsque de faibles doses d’ADN sont utilisées (p<10-5 pour une dose de 2 ng 
d’ADN et p<10-2 pour une dose de 10 yg), alors que l’effet du signal CTE reste marginal (p=0,34 pour une dose de 2 
pg d’ADN). 

[0343] Enfin, les anticorps induits chez la souris aprés immunisation génique neutralisent l’infectivité du SRAS-CoV 
in vitro (figures 29A et 29B) a des titres qui sont en rapport avec les titres mesurés par ELISA. 

[0344] Enrésumé, utilisation d’un signal d’épissage et du signal post-transcriptionnel WPRE du virus de I’hépatite 
de la marmotte améliore de fagon considérable l’induction d’anticorps neutralisants dirigés contre le SRAS-CoV aprés 
immunisation génique a l'aide d’ADN plasmidique dirigeant l’expression du cADN de la S du SRAS-CovV. 


Exemple 13 : Applications diagnostiques de la protéine S 


[0345] Laréactivité en ELISA du polypeptide recombinant Ssol a été analysée vis-a-vis de sérums de patients atteints 
de SRAS. 

[0346] Les sérums de cas probables de SRAS testés ont été choisis sur la base des résultats (positifs ou négatifs) 
d’analyse de leur réactivité spécifique vis-a-vis des antigénes natifs du SRAS-CoV par test d’immunofluorescence sur 
cellules VeroE6 infectées par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme antigéne un lysat de cellules 
VeroE6 infectées par le SRAS-CoV. Les sérums de ces patients sont identifiés par un numéro d’ordre du Centre National 
de Référence des Virus Influenzae ainsi que par les initiales du patient et le nombre de jours écoulés depuis le début 
des symptomes. Tous les sérums de cas probables (cf Tableau XII) reconnaissent les antigénes natifs du SRAS-CoV, 
a l'exception du sérum 032552 du patient VTT, pour lequel l'infection par le SRAS-CoV n’a pas pu étre confirmée par 
RT-PCR réalisée sur prélevements respiratoires des jours 3, 8 et 12. Un panel de sérums témoin a été utilisé a titre de 
contréle (sérums TV): il s’agit de sérums prélevés en France avant l’épidémie de SRAS survenue en 2003. 


Tableau XII : serums de cas probables de SRAS 












































sérum patient jour de prélevement 
031724 JYK 7 
033168 JYK 38 
033597 JYK 74 
032632 NTM 17 
032634 THA 15 
032541 PHV 10 
032542 NIH 17 
032552 VIT 8 
032633 PTU 16 
032791 JLB 3 
033258 JLB 27 
032703 JCM 8 
033153 JCM 29 
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[0347] Des phases solides sensibilisées par le polypeptide recombinant Ssol ont été préparées par adsorption d’une 
solution de polypeptide Ssol purifié a 2 ug/ml en PBS dans les puits d’une plaque ELISA, puis les plaques sont incubées 
une nuit a 4°C et lavées avec du tampon PBS-Tween (PBS, 0,1% Tween20). Aprés saturation des plaques ELISA par 
une solution de PBS-lait écrémé a 10% (poids/volume) et lavage en PBS-tween, les sérums a tester (100 pl) sont dilués 
au 1/400 dans du tampon PBS-lait écrémé-Tween (PBS, 3% lait écrémé, 0,1% Tween) puis ajoutés dans les puits de 
la plaque ELISA sensibilisée. Les plaques sont incubées 1h a 37°C. Aprés 3 lavages avec du tampon PBS-Tween, le 
conjugué anti-IgG humaines marqué a la peroxidase (réf NA933V, Amersham) dilué au 1/4000 dans du tampon PBS- 
lait écrémé-Tween est ajouté, puis les plaques sont incubées une heure a 37°C. Aprés 6 lavages avec du tampon PBS- 
Tween, le chromogéne (TMB) et le substrat (H2O.) sont ajoutés et les plaques sont incubées 10 minutes a l’abri de la 
lumiére. La réaction est arrétée par ajout d’une solution 1N de H3PQ,, puis l’absorbance est mesurée a 450 nm avec 
un référence a 620nm. 

[0348] Les tests ELISA (figure 30) démontrent que le polypeptide recombinant Ssol est reconnu spécifiquement par 
les anticorps sériques de patients atteints de SRAS prélevés en phase moyenne ou tardive de l’infection (= 10 jours 
aprés le début des sympt6émes alors qu’il n’est pas reconnu de facon significative par les anticorps sériques de deux 
patients (JLB et JCM) prélevés en phase précoce de l’infection (3 a 8 jours aprés le début des sympt6mes) ni par des 
sérums témoins de sujets non atteints de SRAS. Les anticorps sériques des patients JLB et JCM montrent une séro- 
conversion entre les jours 3 et 27 pour le premier et 8 et 29 pour le second aprés le début des symptémes, ce qui 
confirme la spécificité de la réactivité de ces sérums vis-a-vis du polypeptide Ssol. 

[0349] Enconclusion, ces résultats démontrent que le polypeptide recombinant Ssol peut étre utilisé comme antigéne 
pour la mise au point d’un test ELISA de diagnostic sérologique de l’infection par le SRAS-CoV. 


Exemple 14 : Applications vaccinales de la protéine S soluble recombinante 


[0350] L’immunogénicité du polypeptide recombinant Ssol a été étudiée chez la souris. 

[0351] Pour cela, un groupe de 6 souris a été immunisé a 3 semaines d’intervalle avec 10 zg de polypeptide recom- 
binant Ssol adjuvé par 1 mg d’hydroxyde d’aluminium (Alu-gel-S, Serva) dilué en PBS. Trois immunisations successives 
ont été réalisées et les sérums immuns ont été prélevés 3 semaines aprés chacune des immunisations (1S1, 1S2, 1S3). 
A titre de contréle, un groupe de souris (groupe mock) a regu de I’hydroxide d’aluminium seul selon le méme protocole. 
[0352] Les sérums immuns ont été analysés par pool pour chacun des 2 groupes par ELISA indirect en utilisant un 
lysat de cellules VeroE6 infectées par le SRAS-CoV comme antigéne et a titre de contréle, un lysat de cellules VeroE6 
non infectées. Les titres en anticorps anti-SRAS-CoV sont calculés comme l’inverse de la dilution produisant une DO 
spécifique de 0,5 aprés révélation par un anticorps polyclonal anti-lgG(H+L) de souris couplé a la peroxidase (NA931 
V, Amersham) et du TMB additionné de H»O, (KPL). Cette analyse (figure 31) montre que l’immunisation par le poly- 
peptide Ssol induit chez la souris dés la premiére immunisation des anticorps dirigés contre la forme native de la protéine 
de spicule du SRAS-CoV présente dans le lysat de cellules VeroE6 infectées. Aprés 2 puis 3 immunisations, les titres 
en anticorps anti-S deviennent trés élevés. 

[0353] Les sérums immuns ont été analysés par pool pour chacun des 2 groupes pour leur capacité a séroneutraliser 
linfectivité du SRAS-CoV. 4 points de séroneutralisation sur cellules FRhK-4 (100 TCID50 de SRAS-CoV) sont réalisés 
pour chacune des dilutions de raison 2 testées a partir du 1/20. Le titre séroneutralisant est calculé selon la méthode 
de Reed et Munsch comme l’inverse de la dilution neutralisant l’infectivité de 2 cupules sur 4. Cette analyse montre que 
les anticorps induits chez la souris par le polypeptide Ssol sont neutralisants : les titres observés sont trés élevés aprés 
2 puis 3 immunisations (supérieurs a 2560 et 5120 respectivement, Tableau XIll). 


Tableau XIll : induction d’anticorps dirigés contre le SRAS-CoV aprés immunisation avec le polypeptide 
recombinant Ssol. Les sérums immuns ont été analysés par pool pour chacun des 2 groupes pour leur capacité a 
séroneutraliser l’infectivité de 100 TCID50 du SRAS-CoV sur cellules FRhK-4. 4 points sont réalisés pour chacune 
des dilutions de raison 2 testées a partir du 1/20. Le titre séroneutralisant est calculé selon la méthode de Reed et 

Munsch comme l’inverse de la dilution neutralisant l’infectivité de 2 cupules sur 4. 

















groupe sérums Ac. Neutralisants 
pi < 20 
IS1 < 20 
Mock 
IS2 < 20 
IS3 < 20 
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(suite) 
groupe sérums Ac. Neutralisants 
pi < 20 
IS1 57 
Ssol 
IS2 > 2560 
IS3 > 5120 

















[0354] Les titres neutralisants observés chez les souris immunisées avec le polypeptide Ssol atteignent des niveaux 
trés supérieurs aux titres observés par Yang et coll. chez la souris (2004, Nature, 428: 561-564) et a ceux observés par 
Buchholz chez le hamster (2004, PNAS 101 : 9804-9809), qui protégent respectivement la souris et le hamster de 
infection par le SRAS-CoV. Il est donc vraisemblable que les anticorps neutralisants induits chez la souris aprés 
immunisation par le polypeptide Ssol protégent ces animaux contre l’infection par le SRAS-CoV. 


Exemple 15 : Gene synthétique optimisé pour l’expression en cellules de mammiféres de la protéine de spicule 
(S) du coronavirus associé au SRAS (SRAS-CoV). 


1) Conception du géne synthétique 


[0355] Un géne synthétique codant pour la protéine de spicule du SRAS-CoV a été concu a partir du géne de l’isolat 
031589 (plasmide pSARS-S, C.N.C.M. n° I-3059) de fagon a permettre des niveaux d’expression élevés dans des 
cellules de mammiféres et en particulier dans les cellules d’origine humaine. 

[0356] Pour cela: 


- usage des codons du géne sauvage de l’isolat 031589 a été modifié de fagon a se rapprocher du biais observé 
chez l'homme et a améliorer l’efficacité de traduction du mRNA correspondant 

- le contenu global en GC du géne a été augmenteé de fagon a prolonger la demi-vie du mRNA correspondant 

- les motifs, éventuellement cryptiques, susceptibles d’interférer avec une expression efficace du géne ont été sup- 
primés (sites donneurs et accepteurs d’épissage, signaux de polyadénylation, séquences trés riches (>80%) ou 
trés pauvres (<30%) en GC, séquences répétées, sequences impliquées dans la formation de structures secondaires 
de l’ARN, boites TATA) 

- _undeuxiéme codon STOP a été ajouté pour permettre une terminaison efficace de la traduction. 


[0357] En outre, des motifs CpG ont été introduits dans le géne de fagon a augmenter son immunogénicité comme 
vaccin a ADN. Afin de faciliter la manipulation du géne synthétique, deux sites de restriction BamH1 et Xho1 ont été 
placés de part et d’autre de la phase ouverte de lecture de la protéine S, et les sites de restriction BamH1, Xho1, Nhe1, 
[0358] La séquence du géne synthétique concu (géne 040530) est donnée en SEQ ID No: 140. 

[0359] Un alignement du géne synthétique 040530 avec la séquence du géne sauvage de l’isolat 031589 du SRAS- 
CoV déposé a la C.N.CM. sous le numéro I-3059 (SEQ ID NO : 4, plasmide pSRAS-S) est présenté dans la figure 32. 


2) Constructions plasmidiques 


[0360] Le géne synthétique SEQ ID No: 140 a été assemble a partir d’oligonucléotides synthétiques et cloné entre 
les sites Kpn1 et Sac1 du plasmide pUC-Kana pour donner le plasmide 040530pUC-kana. La séquence nucléotidique 
de l’insert du plasmide 040530pUC-kana a été vérifiée par sequengage automatique (Applied). 

[0361] Un fragment Kpn1-Xho1 contenant le géne synthétique 040530 a été excisé du plasmide 040530pUC-kana et 
sous-cloné entre les sites Nhe1 et Xho1 du plasmide d’expression pCl (Promega) pour obtenir le plasmide pCI-SSYNTH, 
déposé a la CNCM le 1&" décembre 2004, sous le numéro |-3333. 

[0362] Un géne synthétique codant pour la forme soluble de la protéine S a ensuite été obtenu en fusionnant les 
séquences synthétiques codant pour l’ectodomaine de la protéine S (acides aminés 1 a 1193) a celles de I’étiquette 
(FLAG : DYKDDDDK) via un linker BspEI codant pour le dipeptide SG. Pratiquement, un fragment d’ADN codant pour 
l’ectodomaine de la S du SRAS-CoV a été amplifié par PCR a l'aide des oligonucléotides 5’--ACTAGCTAGC GGATC- 
CACCA TGTTCATCTT CCTG -3’ et 5’- AGTATCCGGAC TTGATGTACT GCTCGTACTT GC-3’ a partir du plasmide 
040530pUC-kana, digéré par Nhe1 et BspEl puis inséré entre les sites uniques Nhe1 et BspEl du plasmide pCl-Ssol, 
pour donner le plasmide pCI-SCUBE, déposé a la CNCM le 1°" décembre 2004, sous le numéro 1-3332. (Les plasmides 
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pCl-Ssol, pCl-Ssol-CTE et pCl-Ssol-WPRE (déposé a la CNCM, le 22 novembre 2004, sous le numéro I-3324) avaient 
été précédemment obtenus par sous-clonage du fragment Kpn1-Xho1 excisé du plasmide pcDNA-Ssol (voir note tech- 
nique de la DI 2004-106) entre les sites Nne1 et Xho1 des plasmides pCl, pCI-S-CTE et pCl-S-WPRE respectivement.) 
[0363] Les plasmides pCl-Scube et pCl-Ssol codent pour le méme polypeptide recombinant Sso1. 


3) Résultats 


[0364] Lacapacité du géne synthétique codant pour la protéine S a diriger efficacement l’expression de la S du SRAS- 
CoV dans des cellules de mammiféres a été comparée a celle du géne sauvage apres transfection transitoire de cellules 
de primates (VeroE6) et de cellules humaines (293T). 

[0365] Dans l’expérience présentée par la figure 33 et au Tableau XIV, des monocouches de 5x105 cellules VeroE6 
ou 7x10 cellules 293T en boites de Pétri de 35mm ont été transfectées avec 2 1g des plasmides pCl (a titre de contréle), 
pCl-S, pCI-S-CTE, pCl-S-WPRE et pCl-Ssynth et 6 wl de réactif Fugene6 selon les indications du fabricant (Roche). 
Apres 48 heures d’incubation a 37°C et sous 5% de COs, des extraits cellulaires ont été préparés en tampon de dépat 
selon Laemmli, séparés sur un gel SDS a 8% de polyacrylamide puis transférés sur une membrane de PVDF (BioRad). 
La détection de cette immunoempreinte (« western blot ») a été réalisée a l’aide d’un sérum polyclonal de lapin anti-S 
(immun-sérum du lapin P11135 : cf exemple 4 ci-dessus) et d’anticorps polyclonaux d’ane dirigés contre les IgG de 
lapin et couplés a la peroxidase (NA934V, Amersham). L’immunoempreinte est révélée de fagon quantitative par lumi- 
nescence a l’aide du kit ECL+ (Amersham) et acquisition sur un dispositif d’imagerie numérique (FluorS, BioRad). 
[0366] L’analyse des résultats obtenus avecle logiciel QuantityOne v4.2.3 (BioRad) montre que dans cette expérience, 
le plasmide pCl-Synth permet l’expression transitoire de la protéine S a des niveaux élevés dans les cellules VeroE6 
et 293T, alors que le plasmide pCI-S ne permet pas d’induire une expression a des niveaux suffisants pour étre détectée. 
Les niveaux d’expression observés sont de l’ordre de 2 fois supérieurs a ceux observés avec le plasmide pCI-S-WPRE. 


Tableau XIV : utilisation d’un géne synthétique pour l’expression de la S du SRAS-CoV. Des extraits cellulaires 
préparés 48 heures aprés transfection de cellulesVeroE6 ou 293T par les plasmides pCl, pCl-S, pCI-S-CTE, pCl-S- 
WPRE et pCl-Ssynth ont été séparés sur un gel SDS a 8% d’acrylamide et analysés par western blot a l’aide d’un 
anticorps polyclonal de lapin anti-S et d’un anticorps polyclonal anti-lgG(H+L) de lapin couplé ala peroxidase (NA934V, 
Amersham). Le western blot est révélé par luminescence (ECL+, Amersham) et acquisition sur un dispositif d’imagerie 
numérique (FluorS, BioRad). Les niveaux d’expression de la protéine S ont été mesurés en quantifiant les 2 bandes 
majoritaires repérées sur l’image (voir figure 33) et sont indiqués en fonction d’une échelle arbitraire ou la valeur de 
1 représente le niveau mesuré aprés transfection du plasmide pCl-S-WPRE. 




















plasmide VeroE6 293T 
pcl 0,0 0,0 
pcl-S <0,1 < 0,1 
pCl-S-CTE 0,5 < 0,1 
pCl-S-WPRE 1,0 1,0 
PCl-Ssynth 1,8 1,9 

















[0367] Dansunsecond temps, la capacité du géne synthétique Scube a diriger efficacement la synthése et la sécrétion 
du polypeptide Ssol par des cellules de mammiféres a été comparée a celle du géne sauvage aprés transfection transitoire 
de cellules de hamster (BHK-21) et de cellules humaines (293T). 

[0368] Dans l’expérience présentée par le Tableau XV, des monocouches de 6x10° cellules BHK-21 et de 7x105 
cellules 293T en boites de Pétri de 35mm ont été transfectées avec 2 wg des plasmides pCl (a titre de contrdle), pCl- 
Ssol, pCl-Ssol-CTE, pCl-Ssol-WPRE et pCl-Scube et 6 jul de réactif Fugene6 selon les indications du fabricant (Roche). 
Aprés 48 heures d’incubation a 37°C et sous 5% de CO2, les surnageants cellulaires ont été prélevés et analysés de 
fagon quantitative pour la sécrétion du polypeptide Ssol par un test ELISA-capture spécifique du polypeptide Ssol. 
[0369] L’analyse des résultats montre que, dans cette expérience, le plasmide pCl-Scube permet l’expression du 
polypeptide Ssol a des niveaux 8 fois (cellules BHK-21) a 20 fois (cellules 293T) plus élevés que le plasmide pCl-Ssol. 
Les niveaux d’expression observés sont de l’ordre de 2 fois (cellules 293T) a 5 fois (cellules BHK-21) supérieurs a ceux 
observés avec le plasmide pCl-Ssol-WPRE. 
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Tableau XV : utilisation d’un géne synthétique pour l’expression du polypeptide Ssol. Les surnageants ont 

été récoltés 48 heures aprés transfection de cellules BHK ou 293T par les plasmides pCl, pCl-Ssol, pCl-Ssol-CTE, 

pCl-Ssol-WPRE et pCl-Scube et analysés de facgon quantitative pour la sécrétion du polypeptide Ssol par un test 

ELISA-capture spécifique du polypeptide Ssol. Les transfections ont été réalisées en dupliqués et les résultats sont 

indiqués sous la forme de moyennes et écart-types des concentrations de polypeptide Ssol (ng/ml) mesurées dans 
les surnageants. 




















Plasmide BHK 293T 
Pci < 20 < 20 
pCl-Ssol < 20 56 + 10 
pCl-Ssol-CTE < 20 63 + 8 
pCl-Ssol-WPRE 28+1 531 + 15 
PCI-Scube 152 +6 1140 + 20 

















[0370] En résumé, ces résultats montrent que l’expression dans des cellules de mammiféres du géne synthétique 
040530 codant pour la S du SRAS-CoV sous la dépendance de séquences promotrices de l’ARN polymérase II est bien 
plus efficace que celle du géne sauvage de l’isolat 031589. Cette expression est méme plus efficace que celle dirigée 
par le géne sauvage en présence des séquences WPRE du virus de I’hépatite de la marmotte. 


4) Applications 


[0371] Lutilisation du géne synthétique 040530 codant pour la S du SRAS-CoV ou de sa variante Scube codant pour 
le polypeptide Ssol est susceptible de remplacer avantageusement le géne sauvage dans de nombreuses applications 
ou l’expression de la S est nécessaire a des niveaux élevés. En particulier pour : 


- améliorer l’efficacité de l’immunisation génique par des plasmides du type pCl-Ssynth voire pCl-Ssynth-CTE ou 
pCl-Ssynth-WPRE 

-  €tablir de nouvelles lignées cellulaires exprimant des quantités plus élevées de la protéine S ou du polypeptide Ssol 
a l'aide de vecteurs lentiviraux recombinants porteurs du géne Ssynth ou du géne Scube respectivement 

- améliorer l’immunogénicité des vecteurs lentiviraux recombinants permettant l’expression de la protéine S ou du 
polypeptide Ssol 

- améliorer l’immunogénicité de vecteurs vivants permettant l’expression de la protéine S ou du polypeptide Ssol 
comme des virus recombinants de la vaccine ou des virus rougeole recombinants (voir exemples 16 et 17 ci-aprés) 


Exemple 16 : Expression de la protéine de spicule (S) du coronavirus associé au SRAS (SRAS-CoV) a l’aide 
de virus recombinants de la Vaccine. 


Application vaccinale. 


Application ala production d’une forme soluble de la protéine de spicule (S) et conception d’un test de sérologie 
du SRAS. 


1) Introduction 


[0372] Le but de cet exemple est d’évaluer la capacité de virus recombinants de la vaccine (VV) exprimant différents 
antigénes du coronavirus associé au SRAS (SRAS-CoV) a constituer de nouveaux candidats vaccins contre le SRAS 
et un moyen de produire des antigéenes recombinants en cellules de mammiféres. 

[0373] Pour cela, les inventeurs se sont intéressés a la protéine de spicule (S) du SRAS-CoV, qui permet d’induire 
aprés immunisation génique chez l’animal des anticorps neutralisants l’infectivité du SRAS-CoV, ainsi qu’a une forme 
soluble et sécrétée de cette protéine, le polypeptide Ssol, qui est composé de l’ectodomaine (aa 1-1193) dela S fusionné 
enson extrémité C-ter a une étiquette FLAG (DYKDDDDK) via un linker BspEI codant pour le dipeptide SG. Ce polypeptide 
Ssol présente une antigénicité similaire a celle de la protéine S et permet, aprés injection a la souris sous la forme d’une 
protéine purifiée adjuvée en hydroxide d’aluminium, l’induction de titres élevés d’anticorps neutralisants contre le SRAS- 
CoV. 
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[0374] Lesdifférentes formes du géne S ont été placées sous la dépendance du promoteur du géne 7.5K puis introduites 
au sein du locus de la thymidine kinase (TK) de la souche Copenhague du virus de la vaccine par double recombinaison 
homologue in vivo. Afin d’améliorer l’immunogénicité des virus vaccine recombinants, un promoteur tardif synthétique 
a été choisi a la place du promoteur 7.5K, pour augmenter la production de S et Ssol au cours des phases tardives du 
cycle viral. 

[0375] Apres avoir isolé les virus vaccine recombinants et vérifié leur capacité a exprimer l’antigene S du SRAS-CoV, 
leur capacité a induire chez la souris une réponse immunitaire contre le SRAS a été testée. Aprés avoir purifié l'antigene 
Ssol du surnageant de cellules infectées, un test ELISA de sérodiagnostic du SRAS a été cong¢u, et son efficacité a été 
évaluée a l'aide de sérums de cas probables de SRAS. 


2) Construction des virus recombinants 


[0376] Des virus recombinants de la vaccine dirigeant l’expression de la glycoprotéine S de l’isolat 031589 du SRAS- 
CoV et d’une forme soluble et sécrétée de cette protéine, le polypeptide Ssol, sous la dépendance du promoteur 7.5K 
ont été obtenus. Dans le but d’augmenter les niveaux d’expression de S et Ssol, des virus recombinants dans lesquels 
les cDNA de S et de Ssol sont placés sous la dépendance d’un promoteur synthétique tardif ont également été obtenus. 
[0377] Le plasmide pTG186poly est un plasmide de transfert pour la construction de virus recombinants de la vaccine 
(Kieny, 1986, Biotechnology, 4 :790-795). A ce titre, il contient le géne de la thymidine kinase du VV dans lequel a été 
inséré le promoteur du géne 7.5K suivi d’un site multiple de clonage permettant l’insertion de génes hétérologues (figure 
34A). Le promoteur du géne 7.5K contient en fait un tandem de deux séquences promotrices actives respectivement 
durant les phases précoces (P.) et tardives (P,_) du cycle de réplication du virus de la vaccine. Les fragments BamH1- 
Xho1 ont été excisés des plasmides pTRIP-S et pcDNA-Ssol respectivement et insérés entre les sites BamH1 et Sma 
du plasmide pTG186poly pour donner les plasmides pTG-S et pTG-Ssol (figure 34A). Les plasmides pTG-S et pTG- 
Ssol ont été déposés a la CNCM, le 2 décembre 2004, sous les numéros I-3338 et 1-3339, respectivement. 

[0378] Les plasmides pTN480, pTN-S et pTN-Ssol ont été obtenus a partir des plasmides pTG186poly, pTG-S et 
pTG-Ssol respectivement, en substituant le fragment Nde1-Pst1 contenant le promoteur 7.5K par un fragment d’ADN 
contenant le promoteur tardif synthétique 480, qui a été obtenu par hybridation des oligonucléotides 5’- TATGAGCTTT 
TTTTTTTTTT TITTTTTGGC ATATAAATAG ACTCGGCGCG CCATCTGCA-3’ et 5’- GATGGCGCGC CGAGTCTATT 
TATATGCCAA AAAAAAAAAA AAA.AAAAAGC TCA-3’ (figure 34B). L’insert a été séquencé a l’aide d’un kit BigDye 
Terminator v1.1 (Applied Biosystems) et d’un séquenceur automatique ABI377. La sequence du promoteur synthétique 
tardif 480 tel que cloné dans les plasmides de transfert de la série pTN est indiquée figure 34C. Les plasmides pTN-S 
et pTN-Ssol ont été déposés a la CNCM, le 2 décembre 2004, sous les numéros I-3340 et I-3341, respectivement. 
[0379] Les virus recombinants de la vaccine ont été obtenus par double recombinaison homologue in vivo entre la 
cassette TK des plasmides de transfert des séries pTG et pTN et le géne TK de la souche Copenhague du virus de la 
vaccine selon une procédure décrite par Kieny et coll. (1984, Nature, 312: 163-166). Brieévement, des cellules CV-1 sont 
transfectées a l’aide de DOTAP (Roche) par de l'ADN génomique de la souche copenhague du virus de la vaccine et 
chacun des plasmides de transfert des séries pTG et pTN décrits ci-dessus, puis surinfectées par le virus vaccine 
auxiliaire VV-ts7 pendant 24 heures a 33°C. Le virus auxiliaire est contre-sélectionné par incubation a 40°C pendant 2 
jours puis les virus recombinants (phénotype TK-) sélectionnés par deux cycles de clonage sous milieu gélosé sur 
cellules 143Btk- en présence de BuDr (25 jig/ml). Les 6 virus VV-TG, VV-TG-S, VV-TG-Ssol, VV-TN, VV-TN-S et VV- 
TN-Ssol ont été respectivement obtenus a l’aide des plasmides de transfert pTG186poly, pTG-S, pTG-Ssol, pTN480, 
pIN-S, pTN-Ssol. Les virus VV-TG et VV-TN n’expriment aucun géne hétérologue et ont été utilisés comme contrdle 
TK- dans les expériences. Les préparations de virus recombinants ont été réalisés sur monocouches de cellules CV-1 
ou BHK-21 et le titre en unités formant plage (u.f.p.) déterminé sur cellules CV-1 selon Earl et Moss (1998, Current 
Protocols in Molecular Biology, 16.16.1-16.16.13). 


3) Caractérisation des virus recombinants 


[0380] L’expression des transgénes codant la protéine S et le polypeptide Ssol a été recherchée par western blot. 
[0381] Des monocouches de cellules CV-1 ont été infectées a une multiplicité de 2 par les différents virus vaccine 
recombinants VV-TG, VV-TG-S, VV-TG-Ssol, VV-TN, VV-TN-S et VV-TN-Ssol. Aprés 18 heures d’incubation a 37°C 
et sous 5% de CO2, des extraits cellulaires ont été préparés en tampon de dépdt selon Laemmli, séparés sur un gel 
SDS a 8% de polyacrylamide puis transférés sur une membrane de PVDF (BioRad). La détection de cette immunoem- 
preinte (« western blot ») a été réalisée a l'aide d’un sérum polyclonal de lapin anti-S (immun-sérum du lapin P11135 : 
cf exemple 4) et d’anticorps polyclonaux d’ane dirigés contre les IgG de lapin et couplés a la peroxidase (NA934V, 
Amersham). Les anticorps fixés ont été révélés par luminescence a l'aide du kit ECL+ (Amersham) et de films d’auto- 
radiographie Hyperfilm MP (Amersham). 

[0382] Comme le montre la figure 35A, le virus recombinant VV-TN-S dirige l’expression de la protéine S a des niveaux 
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qui sont comparables a ceux que l’on peut observer 8h aprés infection par le SRAS-CoV mais qui sont bien plus élevés 
que ceux que l’on peut observer aprés infection par W-TG-S. Dans une deuxiéme expérience (figure 35B), l’'analyse de 
quantités variables d’extraits cellulaires montre que les niveaux d’expression observés aprés infection par les virus de 
la série TN (VV-TN-S et VV-TN-Ssol) sont environ 10 fois plus élevés que ceux observés avec les virus de la série TG 
(VV-TG-S et VV-TG-Ssol respectivement). En outre, le polypeptide Ssol est sécrété dans le surnageant de cellules CV- 
1 infectées par le virus VV-TN-Ssol plus efficacement que dans le surnageant de cellules infectées par VV-TG-Ssol 
(figure 36A). Dans cette expérience, le virus VV-TN-Sflag a été utilisé a titre de contrdle, car il exprime la forme mem- 
branaire de la protéine S fusionnée en son extrémité C-ter a l’étiquette FLAG. La protéine Sflag n’est pas détectée dans 
le surnageant des cellules infectées par VV-TN-Sflag, démontrant que le polypeptide Ssol est bien sécrété de fagon 
active aprés infection par VV-TN-Ssol. 

[0383] Ces résultats démontrent que les virus vaccine recombinants sont bien porteurs des transgénes et permettent 
l’expression de la glycoprotéine du SRAS sous sa forme membranaire (S) ou sous une forme soluble et sécrétée (Ssol). 
Les virus vaccine porteurs du promoteur synthétique 480 permettent l’expression de S et la sécrétion de Ssol a des 
niveaux bien plus élevés que les virus porteurs du promoteur du géne 7.5K. 


4) Application a la production d’une forme soluble de la S du SRAS-CoV. Purification de cet antigene recom- 
binant et applications diagnostiques. 


[0384] La lignée BHK-21 est la lignée cellulaire qui sécréte les quantités les plus élevées de polypeptide Ssol aprés 
infection par le virus VV-TN-Ssol parmi les lignées testées (BHK-21, CV1, 293T et FrhK-4, figure 36B); elle permet la 
production et la purification en quantité du polypeptide recombinant Ssol. Dans une expérience type ou les conditions 
expérimentales d’infection, de production et de purification ont été optimisées, les cellules BHK-21 sont ensemencées 
en milieu de culture standard (DMEM sans pyruvate contenant 4.5g/I de glucose et supplémenté par 5% de TPB, 5% 
de SVF, 100 U/ml de pénicilline et 100 ug/ml de streptomycine) sous la forme d’une monocouche sous-confluente (10 
millions de cellules pour chaque 100 cm? dans 25 ml de milieu). Aprés 24h d’incubation a 37°C sous 5% de CO,, les 
cellules sont infectées a une M.O.I. de 0.03 et le milieu standard remplacé par le milieu de sécrétion ou la quantité de 
SVF est abaissée a 0.5% et le TPB supprimé. Le surnageant de culture est prélevé aprés 2,5 jours d’incubation a 35°C 
et sous 5% de CO, et le virus de la vaccine inactivé par addition de triton X-100 (0,1%). Aprés filtration sur membrane 
de polyethersulfone (PES) de 0.1 wm, le polypeptide recombinant Ssol est purifié par une chromatographie d’affinité 
sur matrice anti-FLAG avec élution par une solution de peptide FLAG (DYKDDDDk) a 100 pg/ml en TBS (Tris 50mM 
pH 7.4, 150 mMNaCl). 

[0385] L’analyse par gel SDS a8 % d’acrylamide coloré au nitrate d’argent a mis en évidence un polypeptide majoritaire 
dont la masse moléculaire est d’environ 180kD et dont le degré de pureté est supérieur a 90% (figure 37).La concentration 
du polypeptide recombinant Ssol purifié a été déterminée par comparaison avec les marqueurs de masse moléculaire 
et estimée a 24 ng/pl. 

[0386] Cette préparation de polypeptide Ssol purifié permet de réaliser une gamme étalon pour mesurer a l’aide d’un 
test ELISA-capture les concentrations de Ssol présentes dans les surnageants de culture. Selon ce test, la lignée BHK- 
21 sécréte environ 1 wg/ml de polypeptide Ssol dans les conditions de production décrites plus haut. En outre, le schema 
de purification présenté permet de purifier de l’ordre de 160 wg de polypeptide Ssol par litre de surnageant de culture. 
[0387] Laréactivité en ELISA du polypeptide recombinant Ssol a été analysée vis-a-vis de sérums de patients atteints 
de SRAS. 

[0388] Les sérums de cas probables de SRAS testés ont été choisis sur la base des résultats (positifs ou négatifs) 
d’analyse de leur réactivité spécifique vis a vis des antigénes natifs du SRAS-CoV par test d’immunofluorescence sur 
cellules VeroE6 infectées par le SRAS-CoV et/ou par test ELISA indirect en utilisant comme antigéne un lysat de cellules 
VeroE6 infectées par le SRAS-CoV. Les sérums de ces patients sont identifiés par un numéro d’ordre du Centre National 
de Référence des Virus Influenzae ainsi que par les initiales du patient et le nombre de jours écoulés depuis le début 
des symptémes. Tous les sérums de cas probables (cf Tableau XVI) reconnaissent les antigénes natifs du SRAS-CoV 
a l'exception du sérum 032552 du patient VTT, pour lequel l'infection par le SRAS-CoV n’a pas pu étre confirmée par 
RT-PCR réalisée sur prélevements respiratoires des jours 3, 8 et 12. Un panel de sérums témoin a été utilisé a titre de 
contréle (sérums TV): il s’agit de sérums prélevés en France avant l’épidémie de SRAS survenue en 2003. 


Tableau XVI : sérums de cas probables de SRAS 














sérum patient jour de prélevement 
033168 JYK 38 
033597 JYK 74 
032632 NTM 17 
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(suite) 
sérum patient jour de prélevement 
032634 THA 15 
032541 PHV 10 
032542 NIH 17 
032552 VIT 8 
032633 PTU 16 

















[0389] Des phases solides sensibilisées par le polypeptide recombinant Ssol ont été préparées par adsorption d’une 
solution de polypeptide Ssol purifié a 4 4g/ml en PBS dans les puits d’une plaque ELISA. Les plaques sont incubées 
une nuit a 4°C puis lavées avec du tampon PBS-Tween (PBS, 0,1% Tween20). Aprés lavage en PBS-tween, les sérums 
a tester (100 wl) sont dilués au 1/100 et 1/400 dans du tampon PBS-lait écrémé-Tween (PBS, 3% lait €crémé, 0,1% 
Tween) puis ajoutés dans les puits de la plaque ELISA sensibilisée. Les plaques sont incubées 1h a 37°C. Aprés 3 
lavages avec du tampon PBS-Tween, le conjugué anti-lgG humaines marqué a la peroxidase (réf NA933V, Amersham) 
dilué au 1/4000 dans du tampon PBS-lait écrémé-Tween est ajouté puis les plaques sont incubées une heure a 37°C. 
Apres 6 lavages avec du tampon PBS-Tween, le chromogene (TMB) et le substrat (H»O.) sont ajoutés et les plaques 
sont incubées 10 minutes a l’abri de la lumiére. La réaction est arrétée par ajout d’une solution 1M de H3PO, puis 
absorbance est mesurée a 450 nm avec une référence a 620nm. 

[0390] Les tests ELISA (figure 38) démontrent que le polypeptide recombinant Ssol est reconnu spécifiquement par 
les anticorps sériques de patients atteints de SRAS prélevés en phase moyenne ou tardive de l’infection (= 10 jours 
aprés le début des sympt6émes), alors qu’il n’est pas reconnu de fagon significative par les anticorps sériques des sérums 
témoins de sujets non atteints de SRAS. 

[0391] En conclusion, ces résultats démontrent que le polypeptide recombinant Ssol peut étre purifié a partir du 
surnageant de cellules de mammiféres infectées par le virus vaccine recombinant W-TN-Ssol et étre utilisé comme 
antigéne pour la mise au point d’un test ELISA de diagnostic sérologique de l’infection par le SRAS-CoV. 


5) Applications vaccinales 


[0392] L’immunogénicité des virus vaccine recombinants a été étudiée chez la souris. 

[0393] Pour cela, des groupes de 7 souris BALB/c ont été immunisés par voie i.v. a deux reprises a 4 semaines 
d’intervalle par 10° u.f.p. de virus vaccine recombinants VV-TG, VV-TG-S, W-TG-Ssol, W-TN, W-TN-S et VV-TN-Ssol 
ainsi que, a titre de contréle, VV-TG-HA qui dirige l’expression de I’hémagglutinine de la souche A/PR/8/34 du virus de 
la grippe. Les sérums immuns ont été prélevés 3 semaines apres chacune des immunisations (1S1, IS2). 

[0394] Les sérums immuns ont été analysés par pool pour chacun des groupes par ELISA indirect en utilisant un lysat 
de cellules VeroE6 infectées par le SRAS-CoV comme antigéne et a titre de contrdle, un lysat de cellules VeroE6 non 
infectées. Les titres (Tl) en anticorps anti-SRAS-CoV sont calculés comme l’inverse de la dilution produisant une DO 
spécifique de 0,5 aprés révélation par un anticorps polyclonal anti-lgG(H+L) de souris couplé a la peroxidase (NA931V, 
Amersham) et du TMB additionné de HO, (KPL). Cette analyse (figure 39A) montre que l’immunisation par le virus 
VV-TG-S et W-TN-S induit chez la souris dés la premiére immunisation des anticorps dirigés contre la forme native de 
la protéine de spicule du SRAS-CovV présente dans le lysat de cellules VeroE6 infectées. Les réponses induites par le 
virus VV-TN-S sont plus élevées que celles induites par le virus VV-TG-S aprés la premiére (TI=740 et TI=270 respec- 
tivement) et la deuxiéme (TI=3230 et TI=600 respectivement) immunisation. Le virus VV-TN-Ssol induit de forts titres 
d’anticorps anti-SRAS-CoV aprés deux immunisations (Tl=640), alors que le virus VV-TG-Ssol induit une réponse a la 
limite de la détection (TI=40). 

[0395] Les sérums immuns ont été analysés par pool pour chacun des groupes pour leur capacité a séroneutraliser 
linfectivité du SRAS-CoV. 4 points de séroneutralisation sur cellules FRhK-4 (100 TCID50 de SRAS-CoV) sont réalisés 
pour chacune des dilutions de raison 2 testées a partir du 1/20. Le titre séroneutralisant est calculé selon la méthode 
de Reed et Munsch comme l’inverse de la dilution neutralisant l’infectivité de 2 cupules sur 4. Cette analyse montre que 
les anticorps induits chez la souris par les virus vaccine exprimant la protéine S ou le polypeptide Ssol sont neutralisants 
et que les virus a promoteurs synthétiques sont des immunogénes plus efficaces que les virus porteurs du promoteur 
7.5K : les titres les plus élevés (640) sont observés aprés 2 immunisations par le virus VV-TN-S (figure 39B). 

[0396] Le pouvoir protecteur des anticorps neutralisants induits chez la souris aprés immunisation par les virus vaccine 
recombinants est évalué a l’aide d’une infection d’épreuve par le SRAS-CoV. 
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6) Autres applications 


[0397] Des virus vaccine recombinants de troisiéme génération sont construits en substituant les sequences sauvages 
des génes S et Ssol par des génes synthétiques optimisés pour l’expression en cellules de mammiféres, décrits ci- 
dessus. Ces virus vaccine recombinants sont susceptibles d’exprimer des quantités plus importantes des antigénes S 
et Ssol et donc de présenter une immunogé€nicité accrue. 

[0398] Le virus vaccine recombinant VV-TN-Ssol peut étre utilisé pour la production en quantité et la purification de 
l'antigéne Ssol en vue d’applications diagnostiques (sérologie par ELISA) et vaccinales (vaccin sous-unitaire). 


Exemple 17 : Virus recombinant de la rougeole exprimant la protéine de spicule (S) du coronavirus associé 
au SRAS (SRAS-CoV). Applications vaccinales. 


1) Introduction 


[0399] Le vaccin rougeole (MV) induit chez l’homme une immunité protectrice de longue durée aprés une seule 
injection (Hilleman, 2002, Vaccine, 20 : 651-665). La protection conférée est trés robuste et repose sur l’induction d’une 
réponse en anticorps et d’une réponse cellulaire CD4 et CD8. Le génome du MV est trés stable et aucune réversion 
vers la virulence des souches vaccinales n’a jamais été observée. Le virus de la rougeole appartient au genre des 
Morbillivirus de \a famille des Paramyxoviridae ; c’est un virus enveloppé dont le genome est un ARN monocaténaire 
de polarité négative de 16kb (figure 40A) et dont le cycle de réplication exclusivement cytoplasmique exclut toute 
possibilité d’intégration dans le genome de |’héte. Le vaccin rougeole est ainsi l'un des vaccins vivants les plus efficaces 
et les plus sdrs utilisés dans la population humaine. L’équipe de Frédéric Tangy a développé récemment un vecteur 
d’expression sur la base de la souche Schwarz du virus de la rougeole, qui est la souche atténuée la plus sdre et la 
plus utilisée chez Il’homme comme vaccin contre la rougeole. Cette souche vaccinale peut étre isolée a partir d’un clone 
moléculaire infectieux en conservant son immunogénicité chez les primates ainsi que chez la souris susceptible a 
l'infection. Elle constitue, aprés insertion d’unités de transcription supplémentaires, un vecteur pour l’expression de 
séquences hétérologues (Combredet, 2003, J. Virol. 77 : 11546-11554). En outre, un MV Schwarz recombinant exprimant 
la glycoprotéine d’enveloppe du virus West Nile (WNV) induit une réponse en anticorps efficace et de longue durée qui 
protége la souris d’une infection d’épreuve létale par le WNV (Despres et al, 2004, J. Infect. Dis., sous presse). Toutes 
ces caractéristiques font de la souche atténuée Schwarz du virus de la rougeole un candidat vecteur extrémement 
prometteur pour la construction de nouveaux vaccins vivants recombinants. 

[0400] Le but de cet exemple est d’évaluer la capacité de virus recombinants de la rougeole (MV) exprimant différents 
antigénes du coronavirus associé au SRAS (SRAS-CoV) a constituer de nouveaux candidats vaccins contre le SRAS. 
[0401] Les inventeurs se sont intéressés a la protéine de spicule (S) du SRAS-CoV, qui permet d’induire aprés 
immunisation génique chez |’animal des anticorps neutralisants l’infectivité du SRAS-CoV, ainsi qu’a une forme soluble 
et sécrétée de cette protéine, le polypeptide Ssol, qui est composé de l’ectodomaine (aa 1-1193) de la S fusionné en 
son extrémité C-ter a une étiquette FLAG (DYKDDDDKk) via un linker BspEl codant pour le dipeptide SG. Ce polypeptide 
Ssol présente une antigénicité similaire a celle de la protéine S et permet, aprés injection a la souris sous la forme d’une 
protéine purifiée adjuvée en hydroxide d’aluminium, l’induction de titres élevés d’anticorps neutralisants contre le SRAS- 
CoV. 

[0402] Les différentes formes du géne S ont été introduites sous la forme d’une unité de transcription supplémentaire 
entre les génes P (phosphoprotéine) et M (matrice) dans le cADN de la souche Schwarz du MV précédemment décrite 
(Combredet, 2003, J. Virol. 77: 11546-11554 ; Demande EP N° 02291551.6 du 20 juin 2002, et Demande EP n° 
02291550.8 du 20 juin 2002). Aprés avoir isolé les virus recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol et 
véerifié leur capacité a exprimer l’antigene S du SRAS-CoV, leur capacité a induire chez la souris puis chez le singe une 
réponse immunitaire protectrice contre le SRAS est testée. 


2) Construction des virus recombinants 


[0403] Le plasmide pTM-MVSchw-ATU2 (figure 40B) contient un cADN infectieux correspondant a l’antigénome de 
la souche vaccinale Schwarz du virus de la rougeole (MV) dans lequel une unité de transcription supplémentaire (ATU) 
a été introduite entre les génes P (phosphoprotéine) et M (matrice) (Combredet, 2003, Journal of Virology, 77: 
11546-11554). Des génomes recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol du virus de la rougeole ont 
été construits par l’insertion des ORFs de la protéine S et du polypeptide Ssol au sein de l’unité de transcription sup- 
plémentaire du vecteur MVSchw-ATU2. 

[0404] Pour cela, un fragment d’ADN contenant le cADN de la S du SRAS-CoV a été amplifié par PCR a l’aide des 
oligonucléotides 5--ATACGTACGA CCATGTTTAT TTTCTTATTA TT TCTTACTC TCACT-3’ et 5’-ATAGCGCGCT CAT- 
TATGTGT AATGTAATTT GACACCCTTG-3’ en utilisant le plasmide pcDNA-S comme matrice puis inséré dans le 
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plasmide pCR®2.1-TOPO (Invitrogen) pour obtenir le plasmide pTOPO-S-MV. Les deux oligonucléotides utilisés con- 
tiennent des sites de restriction BsiW1 et BssHIl, de fagon a permettre l’insertion ultérieure dans le vecteur rougeole, 
et ont été congus de fagon a générer une séquence de 3774 nt incluant les codons d’initiation et de terminaison, afin 
de respecter la régle des 6 qui stipule que la longueur du génome d’un virus rougeole doit étre divisible par 6 (Calain & 
Roux, 1993, J. Virol., 67 : 4822-4830 ; Schneider et al., 1997, Virology, 227 : 314-322). L’insert a été séquencé a l'aide 
d’un kit BigDye Terminator v1.1 (Applied Biosystems) et d’un séquenceur automatique ABI377. 

[0405] Afin d’exprimer une forme soluble et sécrétée de la S du SRAS-CoV, un plasmide contenant l’ADNc du poly- 
peptide Ssol correspondant a l’ectodomaine (aa 1-1193) de la S du SRAS-CoV fusionné en son extrémité C-ter a la 
séquence d’une étiquette FLAG (DYKDDDDK) via un linker BspEI codant pour le dipeptide SG a ensuite été obtenu. 
Pour cela, un fragment d’ADN a été amplifié a l’aide des oligonucléotides 5’--CCATTTCAAC AATTTGGCCG-3’ et 5’- 
ATAGGATCCG CGCGCTCATT ATTTATCGTC GTCATCTTTA TAATC-3’ a partir du plasmide pCDNA-Ssol puis inséré 
dans le plasmide pTOPO-S-MV entre les sites Sall et BamH1 pour obtenir le plasmide pTOPO-S-MV-SF. La séquence 
générée est longue de 3618 nt entre les sites BsiW1 et BssHIl et respecte la régle des 6. L’insert a été sequencé comme 
indiqué ci-dessus. 

[0406] Les fragments BsiW1-BssHII contenant les ADNc de la protéine S et du polypeptide Ssol ont ensuite été excisés 
par digestion des plasmides pTOPO-S-MV et pTOPO-S-MV-SF puis sous-clonés entre les sites correspondants du 
plasmide pTM-MVSchw-ATU2 pour donner les plasmides pTM-MVSchw2-SARS-S et pTM-MVSchw2-SARS-Ssol (fi- 
gure 40B). Ces deux plasmides ont été déposés a la C.N.C.M. le 1°" décembre 2004, sous les numéros |-3326 et I- 
3327, respectivement. 

[0407] Les virus rougeole recombinants correspondants aux plasmides pTM-MVSchw2-SARS-S et pTM-MVSchw2- 
SARS-Ssol ont été obtenus par génétique inverse selon le systeme reposant sur |’utilisation d’une lignée cellulaire 
auxiliaire, décrit par Radecke et coll. (1995, Embo J., 14, : 5773-5784) et modifié par Parks et coll. (1999, J. Virol., 73 : 
3560-3566). Briévement, les cellules auxiliaires 293-3-46 sont transfectées selon la méthode au phosphate de calcium 
par 5 wg des plasmides pTM-MVSchw2-SARS-S ou pTM-MVSchw2-SARS-Ssol et 0,02 wg du plasmide pEMC-La 
dirigeant l’expression de la polymérase L du MV (don de M.A. Billeter). Aprés une nuit d’incubation a 37°C, un choc 
thermique est réalisé pendant 2 heures a 43°C et les cellules transfectées sont transférées sur une monocouche de 
cellules Vero. Pour chacun des deux plasmides, des syncytia sont apparus aprés 2 a 3 jours de co-culture et ont été 
transférés successivement sur des monocouches de cellules Vero a 70% de confluence en boites de pétri de 35 mm 
puis en flacons de 25 et 75 cm2. Quand les syncytia ont atteint 80-90% de confluence, les cellules sont recupérées a 
l'aide d’un grattoir puis congelées et décongelées une fois. Aprés une centrifugation a basse vitesse, le surnageant 
contenant le virus est conservé en aliquot a -80°C. Les titres des virus recombinants MVSchw2-SARS-S et MVSchw2- 
SARS-Ssol ont été déterminés par dilution limite sur cellules Vero et le titre en dose infectant 50% des cupules (TCIDs5) 
calculé selon la méthode de Karber. 


3) Caractérisation des virus recombinants 


[0408] L’expression des transgénes codant la protéine S et le polypeptide Ssol a été recherchée par western blot et 
immunofluorescence. 

[0409] Des monocouches de cellules Vero en flacons T-25 ont été infectées a une multiplicité de 0,05 par différents 
passages des deux virus MVSchw2-SARS-S et MVSchw2-SARS-Ssol et le virus sauvage MWSchw a titre de contrdle. 
Quand les syncytia ont atteint 80 a 90% de confluence, des extraits cytoplasmiques ont été préparés dans un tampon 
d’extraction (150mMNaCl, 50 mM Tris-HCl pH 7,2, 1% triton-X-100, 0,1% SDS, 1% DOC) puis dilués en tampon de 
dépét selon Laemmli, séparés sur un gel SDS a 8% de polyacrylamide et transférés sur une membrane de PVDF 
(BioRad). La détection de cette immunoempreinte (« western blot») a été réalisée a l’aide d’un sérum polyclonal de lapin 
anti-S (immun-sérum du lapin P11135 : cf exemple 4 ci-dessus) et d’anticorps polyclonaux d’ane dirigés contre les IgG 
de lapin et couplés a la peroxidase (NA934V, Amersham). Les anticorps fixés ont été révélés par luminescence a l’aide 
du kit ECL+ (Amersham) et de films d’autoradiographie Hyperfilm MP (Amersham). 

[0410] Descellules Vero en monocouches sur lamelles de verre ont été infectées par les deux virus MVSchw2-SARS- 
S et MVSchw2-SARS-Ssol et le virus sauvage MWSchw a titre de contrdéle a des multiplicités d’infection de 0,05. Quand 
les syncytia ont atteint 90 a 100% (virus MVSchw2-SARS-Ssol) ou 30 a 40% (MVSchw2-SARS-S,MWSchw) de con- 
fluence, les cellules ont été fixées dans une solution de PBS-PFA 4%, perméabilisées par une solution de PBS contenant 
0,2% de triton puis marquées par des anticorps polyclonaux de lapins hyperimmunisés par des virions purifiés et inactivés 
du SRAS-CoV et par un conjugué d’anticorps de chévre anti-lgG(H+L) de lapin couplé au FITC (Jackson). 

[0411] Comme le montrent les figures 41 et 42, les virus recombinants MVSchw2-SARS-S et MVSchw2-SARS-Ssol 
dirigent l’expression de la protéine S et du polypeptide Ssol respectivement a des niveaux comparables a ceux que l’on 
peut observer 8h aprés infection par le SRAS-CoV. L’expression de ces polypeptides est stable aprés 3 passages des 
virus recombinants en culture cellulaire. Ces résultats démontrent que les virus rougeole recombinants sont bien porteurs 
des transgénes et permettent l’expression de la glycoprotéine du SRAS sous sa forme membranaire (S) ou sous une 
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forme soluble (Ssol). On s’attend a ce que le polypeptide Ssol soit sécrété des cellules infectées par le virus MVSchw2- 
SARS-Ssol comme c’est le cas lorsque ce méme polypeptide est exprimé dans des cellules de mammiféres aprés 
transfection transitoire des séquences correspondantes (cf exemple 11 ci-dessus). 


4) Applications 


[0412] Ayant montré que les virus MVSchw2-SARS-S et MVSchw2-SARS-Ssol permettent l’expression de la S du 
SRAS-CoV, leur capacité a induire une réponse immunitaire protectrice contre le SRAS-CoV chez la souris CD46*/- 
IFN-oBR~, qui est susceptible a l’infection par le MV, est évaluée. La réponse en anticorps des souris immunisées est 
évaluée par test ELISA contre les antigénes natifs du SRAS-CoV et pour leur capacité a neutraliser l’infectivité du SRAS- 
CoV in vitro, en utilisant les méthodologies décrites ci-dessus. Le pouvoir protecteur de la réponse sera évalué en 
mesurant la réduction de la charge virale pulmonaire 2 jours aprés une infection d’épreuve non létale par le SRAS-CoV. 
[0413] Des virus rougeole recombinants de seconde génération sont construits en substituant les sequences sauvages 
des génes S et Sol par des génes synthétiques optimisés pour |’expression en cellules de mammifeéres, décrits al’exemple 
15 ci-dessus. Ces virus rougeole recombinants sont susceptibles d’exprimer des quantités plus importantes des anti- 
genes S et Ssol et donc de présenter une immunogénicité accrue. 

[0414] Alternativement, les genes sauvages ou synthétiques codant pour la protéine S ou le polypeptide Ssol peuvent 
étre insérés dans le vecteur rougeole MVSchw-ATU3 sous la forme d’une unité de transcription supplémentaire localisée 
entre les génes H et L, puis les virus recombinants produits et caractérisés de facon similaire. Cette insertion est 
susceptible de générer des virus recombinants possédant des caractéristiques (multiplication du virus, niveau d’expres- 
sion du transgéne) différentes et possiblement une immunogénicité améliorée par rapport a ceux obtenus aprés insertion 
des transgénes entre les génes P et N. 

[0415] Le virus rougeole recombinant MVSchw2-SARS-Ssol peut étre utilisé pour la production en quantité et la 
purification de l’antigéne Ssol en vue d’applications diagnostiques et vaccinales. 


Exemple 18 : Autres applications liées a la protéine S 
[0416] 


a) Les vecteurs lentiviraux permettant l’expression de la S ou de Ssol (voire de fragments de la S) peuvent constituer 
unvaccin recombinant contre le SRAS-CoV, pour étre utilisé en prophylaxie humaine et vétérinaire. Afin de démontrer 
la faisabilité d’un tel vaccin, limmunogénicité des vecteurs lentiviraux recombinants TRIP-SD/SA-S-WPRE et TRIP- 
SD/SA-Ssol-WPRE est étudiée chez la souris. 

b) Des anticorps monoclonaux sont produits a l'aide du polypeptide recombinant Ssol. D’aprés les résultats présentés 
a l’exemple 14 ci-dessus, ces anticorps ou du moins la majorité d’entre eux reconnaitront la forme native de la S 
du SRAS-CoV et seront susceptibles d’applications diagnostiques et/ou prophylactiques. 

c) Un test de sérologie du SRAS est mis au point avec le polypeptide Ssol utilisé comme antigéne et la méthodologie 
du double épitope. 


SEQUENCE LISTING 
[0417] 


<110> INSTITUT PASTEUR 
CENTRE NATIONAL DE LA RECHERCHE SCIENTIFIQUE 
UNIVERSITE PARIS 7 

VAN DER WERF, Sylvie 

ESCRIOU, Nicolas 
CRESCENZO-CHAIGNE, Bernadette 
MANUGUERRA, Jean-Claude 
KUNST, Franck 

CALLENDRET, Benoit 

BETTON, Jean-Michel 

LORIN, Valérie 

GERBAUD, Sylvie 

BURGUIERE, Ana Maria 

AZEBI, Saliha 

CHARNEAU, Pierre 
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TANGY, Frédéric 
COMBREDET, Chantal 


DELAGNEAU, Jean-Francois 


MARTIN, Monique 


<120> NOUVELLE SOUCHE DE CORONAVIRUS ASSOCIE AU SRAS ET SES APPLICATIONS 


<130> 226-108ext 


<150> FR 0314152 
<151> 2003-12-02 


<150> FR 0314151 
<151> 2003-12-02 


<160> 158 

<170> Patentin version 3.1 
<210> 1 

<211> 29746 

<212> DNA 

<213> CORONAVIRUS 


<400> 1 
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atattaggtt 
ctctaaacga 
gcagtataaa 
tctgcagact 
gtccgggtgt 
cacgtccaac 
gactctgtgg 
ctagtagagc 
cgttctgatg 
gacggcattc 
gaaaccccaa 
ggtcatagct 
cccattgaag 
ctcactcgtg 
ccagatgggt 
tgcactcttt 
gaccatgagc 
acacccttcg 
tttgtgtttc 
actgagggtt 
aacaatatgc 
acgtgcgact 
ggacctacta 
tgtcaagacc 
attgaaactc 
tatgttggct 


tcaggccata 


tttacctacc 
actttaaaat 
caataataaa 
gcttacggtt 
gaccgaaagg 
tcagtttgcc 
aagaggccct 
tggaaaaagg 
ccttaagcac 
agtacggtcg 
ttgcataccg 
atggcatcga 
attatgaaca 
agctcaatgg 
accctcttga 
ccgaacaact 
atgaaattgc 
aaattaagag 
ctcttaactc 
tcatggggcg 
acttgtctac 
ttctgaaagc 
catgtgggta 
cagagattgg 
gactccgcaa 
gctataataa 


ctggcattac 
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caggaaaagc 
ctgtgtagct 
ttttactgtc 
tcgtccgtgt 
taagatggag 
tgtccttcag 
atcggaggca 
cgtactgccc 
caatcacggc 
tagcggtata 
caatgttctt 
tctaaagtct 
aaactggaac 
aggtgcagtc 
ttgcatcaaa 
tgattacatc 
ctggttcact 
tgccaagaaa 
aaaagtcaaa 
tatacgctct 
cttgatgaaa 
cacttgtgaa 
cctacctact 
acctgagcat 
gggaggtagg 
gcgtgcctac 
tggtgacaat 


caaccaacct 
gtcgctcggc 
gttgacaaga 
tgcagtcgat 
agccttgttc 
gttagagacg 
cgtgaacacc 
cagcttgaac 
cacaaggtcg 
acactgggag 
cttcgtaaga 
tatgacttag 
actaagcatg 
actcgctatg 
gattttctcg 
gagtcgaaga 
gagcgctctg 
tttgacactt 
gtcattcaac 
gtgtaccctg 
tgotaatcatt 
cattgtggca 
aatgctgtag 
agtgttgcag 
actagatgtt 
tgggttcctc 
gtggagacct 
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cgatctcttg 
tgcatgccta 
aacgagtaac 
catcagcata 
ttggtgtcaa 
tgctagtgcg 
tcaaaaatgg 
agccctatgt 
ttgagctggt 
tactcgtgcc 
acggtaataa 
gtgacgagct 
gcagtggtgc 
tcgacaacaa 
cacgcgcggg 
gaggtgtcta 
ataagagcta 
tcaaagggga 
cacgtgttga 
ttgcatctcc 
gcgatgaagt 
ctgaaaattt 
tgaaaatgcc 
attatcacaa 
ttggaggctg 
gtgctagtgc 
tgaatgagga 


tagatctgtt 
gtgcacctac 
tcgtccctct 
cctaggtttc 
cgagaaaaca 
tggcttcggg 
cacttgtggt 
gttcattaaa 
tgcagaaatg 
acatgtgggc 
gggagccggt 
tggcactgat 
actccgtgaa 
tttctgtgge 
caagtcaatg 
ctgctgccgt 
cgagcaccag 
atgcccaaag 
aaagaaaaag 
acaggagtgt 
ttcatggcag 
agttattgaa 
atgtcctgcc 
ccactcaaac 
tgtgtttgcec 
tgatattggc 
tctccttgag 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
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atactgagtc 
gttgccatca 
agtcttgatt 
aagggaaagc 
ctgtgtggtt 
gatgcagcaa 
atttctgaac 
aacagtgtca 
ttgtctaatc 
gcgaaactta 
attacaggtg 
gattgtgtaa 
gtcactatcg 
agcaagggac 
cttaaggcac 
tctgaggagg 
ttcacaaatg 
attaaggaca 
tttcgcttaa 
gaagttcaag 
gtgcttaatg 
gcatgtgttg 
aacatgggta 
ggtgaagaaa 
gaggacgatg 
acagaggatg 
gttgaggaag 
ccagaaccag 
actgacaatg 
atggtgattg 
ctcaacaagg 
ggccctctta 
ctgcatgttg 


tatgaaaatt 


gtgaacgtgt 
ttttggcatc 
acaagtcttt 
ccgtaaaagg 
ttccctcaca 
accactcaat 
agtcattacg 
ttattatggc 
ttttgggcac 
gtgcaggagt 
tttttgacat 
aatgcttcat 
ctggcgcaaa 
tttaccgtca 
Caaaagaagt 
ttgttctcaa 
gagctatcgt 
aagaacaata 
aagggggtgc 
gttacaagaa 
aaaagtgctc 
tagcagaggc 
ttgatcttga 
acttttcatc 
Cagagtgtga 
attatcaagg 
aagaagagga 
aacctacacc 
ttgccattaa 
taaatgctgc 
caaccaatgg 
cagtaggagg 
ttggacctaa 


tcaattcaca 
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taacattaac 
tttctctgct 
caaaaccatt 
tgcttggaac 
ggctgctggt 
tcectgatttg 
tcttgtcgac 
atatgtaact 
tactgttgaa 
tgaatttctc 
cgtcaagggt 
tgatgttgtt 
gttgcgatca 
gtgtatacgt 
aacctttctt 
gaacggtgaa 
tggcacacca 
ctgcgcattg 
accaattaaa 
tgtgagaatc 
tgtctacact 
tgttgtgaag 
tgagtggagt 
acgtatgtat 
ggaagaagaa 
tctccctctg 
agactggctg 
tgaagaacca 
atgtgttgac 
taacatacac 
tgccatgcaa 
gtcttgtttg 
cctaaatgca 


ggacatctta 


attgttggcg 
tctacaagtg 
gttgagtcct 
attggacaac 
gttatcagat 
caaagagcag 
gccatggttt 
ggtggtcttg 
aaactcaggc 
aaggatgctt 
caaatacagg 
aacaaggcac 
ctcaacttag 
ggcaaggagce 
gaaggtgatt 
ctcgaagcac 
gtctgtgtaa 
tctcctggtt 
ggtgtaacct 
acatttgagc 
gttgaatccg 
actttacaac 
gtagctacat 
tgttcctttt 
attgatgaaa 
gaatttggtg 
gatgatacta 
gttaatcagt 
atcgttaagg 
ctgaaacatg 
aaggagagtg 
ctttctggac 
ggtgaggaca 
cttgcaccat 
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attttcattt 
cctttattga 
gcggtaacta 
agagatcagt 
caatttttge 
ctgtcaccat 
atacttcaga 
tacaacagac 
ctatctttga 
gggagattct 
ttgcttcaga 
tcgaaatgtg 
gtgaagtctt 
agctgcaact 
cacatgacac 
tcgagacgcc 
atggcctcat 
tactggctac 
ttggagaaga 
ttgatgaacg 
gtaccgaagt 
cagtttctga 
tctacttatt 
accctccaga 
cctgtgaaca 
cctcagctga 
ctgagcaatc 
ttactggtta 
aggcacaaag 
gtggtggtgt 
atgattacat 
ataatcttgce 
tccagettct 
tgttgtcagc 


gaatgaagag 
cactataaag 
taaagttacc 
tttaacacca 
gcgcacactt 
acttgatggt 
cctgctcacc 
ttctcagtgg 
atggattgag 


caaatttctc 


taacatcaag | 


cattgatcaa 
catcgctcaa 
actcatgcct 
agtacttacc 
cgttgatagce 
gctcttagag 
aaacaatgtc 
tactgtttgg 
tgttgacaaa 
tactgagttt 
tctccttace 
tgatgatgct 
tgaggaagaa 
tgagtacggt 
aacagttcga 
agagattgag 
tttaaaactt 
tgctaatcct 
agcaggtgca 
taagctaaat 
taagaagtgt 
taaggcagca 


aggcatattt 


1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 


20 


25 


30 


35 


40 


45 


50 
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ggtgctaaac 
attgcagtca 
aagcctagag 
gaggagaaat 
gatgaggtta 
gctgatatca 
tctttccttg 
acttgtgttg 
ttgaagaaag 
tatacacttg 
ccttcagaag 
gaaatgcttg 
gccataatgg 
gactatggtg 
aagctgaact 
tttaatcttg 
gtatcatcac 
tctgaggage 
tcaggacage 
cacactctgg 
ctaaagagtc 
aacactaatc 
ccaacatact 
aagactttct 
catactcttg 
tggaaatttc 
ttgtctagtg 
caagaggctt 
gcttacagta 
ctacagcatg 
ggtcagaaaa 
tatgataatc 
tatctagtac 


ttacagcaag 


cacttcagtc 
atgacaaagc 
tggaagcacc 
ctgtcgtaca 
ccacaacact 
atggtaagct 
agaaggatgc 
taataccctc 
tgccagttga 
aggaagctaa 
cacctaatgc 
ctcatgctga 
caaccatcca 
tecgattctt 
ctctaaatga 
aagaggctgc 
cagatgctgt 
actttgtaga 
gtacagagtt 
agagccccgt 
tcttatecct 
tccacacaca 
tggatggtgc 
ttgtactacc 
atgagagttt 
ctcaagttgg 
ttttattagc 
attatagagc 
ataaaactgt 
ctaatttgga 
ctactacctt 
ttaagacagg 
aacaagagtc 


gtacattctt 
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tttacaagtg 
tctttatgag 
taaacaagag 
gaagcctgtc 
ggaagaaact 
ttaccatgat 
accttacatg 
caaaaaggct 
tgagtatata 
gactgctctt 
taaggaagag 
agagacaaga 
acgtaagtat 
cttttatact 
gccgcttgtc 
gcgctgtatg 
tactacatat 
aacagtttct 
aggtgttgaa 
cgagtttcat 
gcgggaggtt 
gcttgtggat 
tgatgttaca 
tagtgatgac 
tcttggtagg 
tggtttaact 
acttcaacag 
ccgtgctggt 
tggcgagctt 
atctgcaaag 
aacgggtgta 
tgtttccatt 
ttcttttgtt 
atgtgcgaat 


tgcgtgcaga 
caggttgtca 
gagccaccaa 
gatgtgaagc 
aagtttctta 
tctcagaaca 
gtaggtgatg 
ggtggcacta 
accacgtacc 
aagaaatgca 
attctaggaa 
aaattaatgc 
aaaggaatta 
agtaaagagc 
acaatgccaa 
cgttctctta 
aatggatacc 
ttggctggct 
tttcttaage 
cttgacggtg 
aagactataa 
atgtctatga 
aaaattaaac 
acactacgta 
tacatgtctg 
tcaattaaat 
cttgaagtca 
gatgctgcta 
ggtgatgtca 
cgagttctta 
gaagctgtga 
ccatgtgtgt 
atgatgtctg 
gagtacactg 


69 


cggttcgtac 
tggattatct 
acacagaaga 
Caaaaattaa 
ccaataagtt 
tgcttagagg 
ttatcactag 
ctgagatgct 
ctggacaagg 
aatctgcatt 
ctgtatcctg 
ctatatgcat 
aaattcaaga 
ctgtagcttc 
ttggttatgt 
aagctcctgc 
tcacttcgtc 
cttacagaga 
gtggtgacaa 
aggttctttc 
aagtgttcac 
catatggaca 
ctcatgtaaa 
gtgaagcttt 
ctttaaacca 
gggctgataa 
aattcaatgc 
acttttgtgc 
gagaaactat 
atgtggtgtg 
tgtatatggg 
gtggtcgtga 
caccacctgc 


gtaactatca 


acaggtttat 
tgataacctg 
ttccaaaact 
ggcctgcatt 
actcttgttt 
tgaagatatg 
tggtgatatc 
ctcaagagct 
atgtgctggt 
ttatgtacta 
gaatttgaga 
ggatgttaga 
gggcatcgtt 
tattattacg 
gacacatggt 
cgtagtgtca 
atcaaagaca 
ttggtcctat 
aattgtgtac 
acttgacaaa 
aactgtggac 
gcagtttggt 
tcatgagggt 
cgagtactac 
Cacaaagaaa 
caattgttat 
accagceactt 
actcatactc 
gacccatctt 
taaacattgt 
tactctatct 
tgctacacaa 
tgagtataaa 
gtgtggtcat 


3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 


20 


25 


30 


35 


40 


45 


50 
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tacactcata 
atgtcagagt 
accatcaagc 
ttggatgggt 
ccaactcaac 
aaatttgctg 
tctgtcacat 
tcagcgagtt 
caggctacaa 
acaaagccag 
atgqgacaatc 
accatacaga 
atacttaaac 
atggctgctt 
gccttaggtt 
agtaaaattt 
tgcgctaaga 
ttgttccaat 
acaactattg 
aattatgtga 
ttaagtattt 
aattttggtg 
gttactacta 
gactcccttg 
ctagacttga 
aaattctttt 
agtcatttca 
cccgtttctg 
agctatgttc 
aatcgtgcca 
gtctatgcaa 
gacacatttt 
cagtttaaaa 


gtgaaaaatg 


taactgctaa 
acaaaggacc 
ctgtgtcgta 
attataaaaa 
cattaccaaa 
atgatttaaa 
tcttcccaga 
tcaagaaagg 
ccaagacaac 
tagatacttc 
ttgcttgtga 
aggaagtcat 
catcagatga 
atgtggaaaa 
taaaaacaat 
tggcttatgt 
gattagcaca 
tgtgtacttt 
ctaaaaatag 
agtcacccaa 
gcttaggttc 
ctccttctta 
tggatttctg 
attcttatcc 
caattttagg 
atttattagg 
tcagcaattc 
caatggttag 
atatcatgga 
cacgcgttga 
atggaggccg 
gcactggtag 
gaccaatcaa 


gcgcgcttca 
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ggagaccctc 
agtgactgat 
taaactcgat 
ggataatgct 
tgacgagtttt 
tcaaatgaca 
cttgaatggc 
tgctaaatta 
gttcaaacca 
aaattcattt 
aagtcaacaa 
agagtgtgac 
aggtgttaaa 
cacaagcatt 
tgccactcat 
caaaccattc 
acgtgtgttt 
tactaaaagt 
tgttaagagt 
attttctaaa 
tctaatctgt 
ttgtaatggc 
tgaaggttct 
agctcttgaa 
tetggccgct 
tctttcagct 
ttggctcatg 
gatgtacatc 
tggttgcacc 
gtgtacaact 
tggcttctgc 
tacattcatt 
ccctactgac 


cctctacttt 


tatcgtattg 
gttttctaca 
ggagttactt 
tactatacag 
gataatttca 
ggcttcacaa 
gatgtagtgg 
ctgcataagc 
aacacttggt 
gaagttctag 
cccacctctg 
gtgaaaacta 
gtaacacaag 
accattaaga 
ggtattgctq 
ttaggacaag 
aacaattata 
accaattcta 
gttgctaaat 
ttgttcacaa 
gtaactgctg 
gttagagaat 
tttccttgca 
accattcagg 
gagtgggttt 
ataatgcagg 
tggtttatca 
ttctttgctt 
tcttcgactt 
attgttaatg 
aagactcaca 
agtgatgaag 
cagtcatcgt 


gacaaggctg 


70 


acggagctca 
aggaaacatc 
acacagagat 
agcagcctat 
aactcacatg 
agccagcttc 
ctattgacta 
caattgtttg 
gtttacgttg 
cagtagaaga 
aagaagtagt 
ccgaagttgt 
agttaggtca 
aacctaatga 
caattaatag 
cagcaattac 
tgccttatgt 
gaattagagc 
tatgtttgga 
tcgctatgtg 
cttttggtgt 
tgtatcttaa 
gcatttgttt 
tgacgatttc 
tggcatatat 
tgttctttgg 
ttagtattgt 
ctttctacta 
gcatgatgtg 
gcatgaagag 
attggaattg 
ttgctcgtga 
atattgttga 


gtcaaaagac 


ccttacaaag 
ttacactaca 
tgaaccaaaa 
agaccttgta 
ttctaacaca 
acgagagcta 
tagacactat 
gcacattaac 
tctttggagt 
cacacaagga 
ggaaaatcct 
aggcaatgtc 
tgaggatctt 
gctttcacta 
tgttccttgg 
aacatcaaat 
gtttacatta 
ttcactacct 
tgccggcatt 
gctattgttg 
actcttatct 
ttcgtctaac 
aagtggatta 
atcgtacaag 
gttgttcaca 
ctattttgct 
acaaatggca 
catatggaag 
ctataagcgc 
atctttctat 
tctcaattgt 
tttgtcactc 
tagtgttgct 
ctatgagaga 


5760 
5820 
5880 
5940 
6000 
6060 


~ 6120 


6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 
7140 
7200 
7260 
7320 
7380 
7440 
7500 
7560 
7620 
7680 
7740 


20 


25 


30 


35 


40 


45 


50 
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catccgctct 


-ctgcctatta 


tctgcttctg 
cttgtatcag 
gacacctttt 
gctcacagcg 
gctgcccgac 
aaactttcac 
acctataata 
gcaaggcata 
aaagactaca 
aacaacatac 
actaaaatct 
gccacattat 
ttgtcaatcc 
gtcactcgtg 
gcatggttta 
gctatcatta 
gcaatcaatg 
tgctacacac 
gctgctgagt 
actaatttgc 
cttatggatg 
gtaacaactt 
atttgcctat 
ggagttttct 
caacctgtgg 
ttggtgactt 
catgttgttg 
ccagcttaca 
ttcaccaatg 
gtgccettttt 
ttctttaaca 


gaggaggctg 


cccattttgt 
atgtcatagt 
tgtactacag 
acgttggaga 
cagcaacttt 
agttagcaaa 


aaggtgttgt 


atcactctga 


aggttgaaaa 
tcaatgccca 
tgtctttatec 
cttttagact 
cactcaaggg 
tgtgcgttct 
atgatggtta 
acatcatttc 
gccagcgtgg 
caagagagat 
gtgacttctt 
cttccaaact 
gtacaatttt 
tagagggttc 
gttccatcat 
ttgatgctga 
ctaccagtgg 
gtggtgttga 
gtgctttaga 
gtgctgccta 
ctgctaatgc 
gctttctgcc 
atgtttcatt 
ggataacage 
actatcttag 
ctttgtgtac 
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caatttagac 
ttttgatgge 
tcagctgatg 
tagtactgaa 
tagtgttcct 
gggtgtagct 
tgataccgat 
cttagaagtg 
catgacgccc 
agtagcaaaa 
tgaacagctg 
aacttgtgct 
tggtaagatt 
tgctgcattg 
cacaaatgaa 
tactgatgat 
tggttcatac 
tggtttcata 
gcattttcta 
cattgagtat 
taaggatgct 
tatttcttat 
acagtttcct 
gtactgtaga 
tagatgggtt 
tgcgatgaat 
tgtgtctgct 
ctactttatg 
acttttgttt 
gggagtctac 
cttggctcac 
aatctatgta 
gaaaagagtc 


ctttttgcetc 


aatttgagag 
aagtccaaat 
tgccaaccta 
gtttccgtta 
atggaaaaac 
ttagatggtg 
gttgacacaa 
acaggtgaca 
agagatcttg 
agtcacaatg 
cgtaaacaaa 
acaactagac 
gttagtactt 
gtttgttata 
atcattggtt 
tgttttgcaa 
aaaaatgaca 
gtgcctggct 
cctcgtgttt 
agtgattttg 
atgggcaaac 
agtgagcttc 
aacacttacc 
catggtacat 
cttaataatg 
ctcatagcta 
tcagtagtgg 
aaattcagac 
ttgatgtctt 
tceagtctttt 
cttcaatggt 
ttctgtattt 
atgtttaatg 


aacaaggaaa 


71 


ctaacaacac 
gcgacgagtc 
ttctgttgct 
agatgtttga 
ttaaggcact 
tectttctac 
aggatgttat 
gttgtaacaa 
gcgcatgtat 
tttcactcat 
ttcgtagtgc 
aggttgtcaa 
gttttaaact 
tcgttatgcc 
acaaagccat 
ataaacatgc 
aaagctgccc 
taccgggtac 
ttagtgctgt 
ctacctctgc 
ctgtgccata 


gtccagacac 


tggagggttc. 


gcgaaaggtc 
agcattacag 
acatctttac 
ctggtggtat 
gtgtttttgg 
tcactatact 
acttgtactt 
ttgccatgtt 
ctctgaagca 
gagttacatt 


tgtacctaaa 


taaaggttca 
tgcttctaag 
tgaccaagct 
tgcttatgtc 
tgttgctaca 
attcgtgtca 
tgaatgtctc 
tttcatgctc 
tgactgtaat 
ctggaatgta 
tgccaagaag 
tgtcataact 
tatgcttaag 
agtacataca 
tcaggatggt 
tggttttgac 
tgtagtagct 
tgtgctgaga 
tggcaacatt 
ttgcgttctt 
ttgttatgac 
tcgttatgtg 
tgttagagta 
agaagtaggt 
agctctatca 
tcectcttgtg 
tattgccata 
tgagtacaac 
ctgtctggta 
gacattctat 
ttctcctatt 
ctgccattgg 
tagtaccttc 
attgcgtagc 


7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 
9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 


20 


25 


30 


35 


40 


45 


50 
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gagacactgt 
tatttcagtg 
aaggctctaa 
tcaatcactt 
gttgaagggt 
gatgacacag 
aactatgaag 
gttcaacttc 
acttctaacc 
tcagttctag 
aatcatacca 
gattatgatt 
gctggtactg 
gctgcaggta 
atcaatggtg 
gtggcaatga 
ctttctgctc 
cagaatggta 
ccatttgatg 
gttaagggca 
caaagtacac 
cttggtatta 
ttgtgcttgt 
cctgctagct 
ggttataggc 
acagctcgca 
acacttgttt 
ttagttattt 
agagctatag 
ttacagtgta 
cttttctgtt 
tctacacaag 
gatgctttca 


gctactgtac 


tgccacttac 
gagccttaga 
atgactttag 
ctgctgttct 
gcatggtaca 
tatactgtcc 
atctgctcat 
gtgttattgg 
ctaagacacc 
catgctacaa 
ttaaaggttc 
gcgtgtcttt 
acttagaagg 
cagacacaac 
ataggtggtt 
agtacaacta 
aaacaggaat 
tgaatggtcg 
ttgttagaca 
ctcatcattg 
agtggtcact 
tggcaattgc 
ttctgttacc 
gggtgatgcg 
ttaaggattg 
ctgtttatga 
acaaagtcta 
ctgtaacctc 
tgtttgtgtg 
tcatgcttgt 
tactcaaccg 
aatttaggta 
agcttaacat 


agtctaaaat 
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acagtataac 
tactaccagc 
caactcaggt 
gcagagtggt 
agtaacctgt 
aagacatgtc 
tcgcaaatcc 
ccattctatg 
caagtataaa 
tggttcacca 
tttccttaat 
ctgctatatg 
taaattctat 
cataacatta 
tcttaataga 
tgaacctttg 
tgccgtctta 
tactatcctt 
atgctctggt 
gatgctttta 
gtttttcttt 
tgcatgtgct 
ttctcttgca 
tatcatgaca 
tottatgtat 
tgatgctgct 
ctatggtaat 
taactattct 
tgttgagtat 
ttattgtttc 
ttacttcagg 
tatgaactcc 
taagttgttg 
gtctgacgta 


aggtatcttg 
tatcgtgaag 
gctgatgttc 
tttaggaaaa 
ggaactacaa 
atttgcacag 
aaccatagct 
caaaattgtc 
tttotccgta 
tctggtgttt 
ggatcatgtg 
catcatatgg 
ggtccatttg 
aatgttttgg 
ttcaccacta 
acacaagatc 
gatatgtgtg 
ggtagcacta 
gttaccttcc 
actttcttga 
gtttacgaga 
atgctgcttg 
acagttgctt 
tggcttgaat 
gcttcagctt 
agacgtgttt 
gctttagatc 
ggtgtcgtta 
tacccattgt 
ttaggctatt 
cttactcttg 
caggggcttt 
ggtattgqgag 
aagtgcacat 


72 


ctctatataa 
cagcttgctg 
tctaccaacc 
tggcattcce 
ctcttaatgg 
cagaagacat 
ttcttgttca 
tgcttaggct 
tccaacctgg 
atcagtgtgc 
gtagtgttgg 
agcttccaac 
ttgacagaca 
catggctgta 
ctttgaatga 
atgttgacat 
ctgctttgaa 
ttttagaaga 
aaggtaagtt 
catcactatt 
atgctttctt 
ttaagcataa 
actttaatat 
tggctgacac 
tagttttgct 
ggacactgat 
aagctatttc 
cgactatcat 
tatttattac 
gttgctgctg 
gtgtttatga 
tgcctcctaa 
gtaaaccatg 


ctgtggtact 


caagtacaag 
ccacttagca 
accacagaca 
gtcaggcaaa 
attgtggttg 
gcttaatcct 
ggctggcaat 
taaagttgat 
tcaaacattt 
catgagacct 
ttttaacatt 
aggagtacac 
aactgcacag 
tgctgctgtt 
ctttaacctt 
attgggacct 
agagctgctg 
tgagtttaca 
caagaaaatt 
gattcttgtt 
gccatttact 
gcacgcattc 
ggtctacatg 
tagcttgtct 
tattctcatg 
gaatgtcatt 
catgtgggcc 
gtttttagct 
tggcaacacc 
ctactttggc 
ctacttggtc 
gagtagtatt 
tatcaaggtt 
gctctcggtt 


9840 

9900 

9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 
11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11700 
11760 
11820 


20 


25 


30 


35 


40 


45 


50 
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“ttcaacaac 
aatgatattc 
tctgttttgc 
gataaccgtg 
gcttatgcca 
gttctcaaaa 
gccatgcaac 
gcaagatctg 
atgcttagga 
tgtgttccac 
gattatggta 
tgggaaatcc 
atggacaatt 
gctgttaaac 
gctggtacca 
aagggaggta 
ttccctaaga 
gttacagaca 
aacctaaata 
aatgctacag 
cctgctaaag 
aagatgttgt 
atggaccaag 
catccaaatc 
tgtgctaatg 
tggaaaggtt 
gcatcaacgt 
caggcactag 
gttttgcaaa 
atttattaga 
agactattta 
ttagagtaga 
tggctgattt 


aaatactcgt 


ttagagtaga 
ttcttgcaaa 
tatccatgca 
ctactcttca 
ctgcccagga 
agttaaagaa 
gcaagttgga 
aggacaagag 
agcttgataa 
tcaacatcat 
cctacaagaa 
agcaagttgt 
caccaaattt 
tacagaataa 
cacaaacagc 
ggtttgtgct 
gtgatggtac 
caccaaaagg 
gaggtatggt 
aagtacctgc 
catataagga 
gtacacacac 
agtcctttgg 
ctaaaggatt 
acccagtggg 
atggctgtag 
ttttaaacgg 
tactgatgtc 
gttcctaaaa 
ctcttacttt 
taacttggtt 
tggtgacatg 
agtctatgct 


cacatacaat 
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gtcatcttct 
agacacaact 
gagtgctgta 
ggctattgct 
ggcctatgag 
atctttgaat 
aaagatggca 
ggcaaaagta 
tgatgcactt 
accattgact 
cacttgtgat 
tgatgcggat 
ggcttggcct 
tgaactgagt 
ttgtactgat 
ggcattacta 
aggtacaatt 
gcctaaagtg 
gctgggcagt 
caattcaact 
ttacctagca 
tggtacagga 
tggtgcttca 
ctgtgacttg 
ttttacactt 
ttgtgaccaa 
gtttgcggtg 
gtctacaggg 
actaattgct 
gtagttaaga 
aaagattgtc 
gtaccacata 
ctacgtcatt 


tgctgtgatg 


aaattgtggg 
gaagctttcg 
gacattaata 
tcagaattta 
caggctgtag 
gtggctaaat 
gatcaggcta 
actagtgcta 
aacaacatta 
acagcagcca 
ggtaacacct 
agcaagattg 
cttattgtta 
ccagtagcac 
gacaatgcac 
tcagaccacc 


tacacagaac 


aaatacttgt. 


ttagctgcta 
gtgctttcct 
agtggaggac 
caggcaatta 
tgttgtctgt 
aaaggtaagt 
agaaacacag 
ctccgcgaac 
taagtgcagc 
cttttgatat 
gtcgcttcca 
ggcatactat 
cagcggttgc 
tatcacgtca 
ttgatgaggg 
atgattattt 


73 


cacaatgtgt 
agaagatggt 
ggttgtgcga 
gttctttacc 
ctaatggtga 
ctgagtttga 
tgacccaaat 
tgcaaacaat 
tcaacaatgc 
aactcatggt 
ttacatatgc 
ttcaacttag 
cagctctaag 
tacgacagat 
ttgcctacta 
aagatctcaa 
tggaaccacc 
acttcatcaa 
cagtacgtct 
tctgtgcttt 
aaccaatcac 
ctgtaacacc 
attgtagatg 
acgtccaaat 
tctgtaccgt 
ccttgatgca 
ccgtcttaca 
ttacaacgaa 
ggagaaggat 
gtctaactac 
tqtccatgac 
gcgtctaact 
taattgtgat 


caataagaag 


acaactccac 
ttctcttttg 
ggaaatgctc 
atcatatgcc 
ttctgaagtc 
ccgtgatgct 
gtacaaacag 
gctcttcact 
gcgtgatagt 
tgttgtccct 
atctgcactc 
tgaaattaac 
agccaactca 


gtcctgtgcg 


taacaattcg . 


atgggctaga 
ttgtaggttt 
aggcttaaac 
tcaggctgga 
tgcagtagac 
caactgtgtg 
agaagctaac 
ccacattgac 
acctaccact 
ctgcggaatg 
gtctgcggat 
ccgtgcggca 
aaagttgctg 
gaggaaggca 
caacatgaag 
tttttcaagt 
aaatacacaa 
acattaaaag 


gattggtatg 


11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 
13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 


20 


25 


30 


35 


40 


45 


50 


55 


acttcgtaga 
aatcattatt 
tactgacatt 
aagtagcacc 
tectcacttt 
cacttattaa 
accgttattt 
ataggtgtat 
caagttttgg 
ctggatacca 
cgcgtctcag 
ctggcaattt 
atgttgcettt 
tgtctaaagg 
aggatggcaa 
gtgatatcag 
atggtggctg 
tcccatttaa 
aagatgcact 
ttaagtatgc 
gtactatgac 
gagctactgt 
ctgtttacag 
gagccatgcc 
cttgctgtaa 
gtgagatggt 
atgctacaac 
taaatgcact 
aacacaggct 
agttttacgc 
tgtgctataa 
cagttcttta 
accttactaa 


atgattacgt 


gaatcctgac 
aaagactgta 
agataatcag 
aggctgcgga 
gactagggca 
gtgggatttg 
taaatattgg 
ccttcattgt 
accactagta 
ttttcgtgag 
tttcaaggaa 
attgctagat 
tcaaactgtc 
tttctttaag 
cgctgctatc 
acaactccta 
tattaatgcec 
taaatggggt 
tttcgcgtat 
cattagtgca 
aaatagacag 
ggtaattgga 
tgatgtagaa 
taacatgctt 
cttatcacac 
catgtgtggce 
tgcttatgct 
tctttcaact 
ctatgagtgt 
ttacctgcgt 
cagtaactat 
ttatcaaaat 
aggacctcac 


gtacctgcct 
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atcttacgcg 
caattctgcg 
gatcttaatg 
gttcctattg 
ttggctgctg 
ctgaaatatg 
gaccagacat 
gcaaacttta 
agaaaaatat 
ttaggagtcg 
cttttagtgt 
aaacgcacta 
aaacccggta 
gaaggaagtt 
agtgattatg 
ttcgtagttg 
aaccaagtaa 
aaggctagac 
actaagcgta 
aagaatagag 
tttcatcaga 
acaagcaagt 
actccacacc 
aggataatgg 
cgtttctaca 
ggctcactat 
aatagtgtct 
gatggtaata 
ctctatagaa 
aaacatttct 
gcggctcaag 
aatgtgttca 
gaattttgct 


tacccagatc 


tatatgctaa 
atgctatgcg 
ggaactggta 
tggattcata 
agtcccatat 
attttacgga 
accatcccaa 
atgtgttatt 
ttgtagatgg 
tacataatca 
atgctgctga 
catgcttttc 
attttaataa 
ctgttgaact 
actattatcg 
aagttgttga 
tcgttaacaa 
tttattatga 
atgtcatccc 
ctcgcaccgt 
aattattgaa 
tttacggtgg 
ttatgggttg 
cctctcttgt 
ggttagctaa 
atgttaaacc 
ttaacatttg 
agatagctga 
atagggatgt 
ccatgatgat 
gtttagtagc 
tgtctgaggce 
cacagcatac 


catcaagaat 


74 


cttaggtgag cgtgtacgcc 
tgatgcaggc attgtaggcg 
cgatttcggt gatttcgtac 
ttactcattg ctgatgccca 
ggatgctgat -ctcgcaaaac 
agagagactt tgtctcttcg 
ttgtattaac tgtttggatg 
ttctactgtg tttccaccta 
tgttcctttt gttgtttcaa 
ggatgtaaac ttacatagct 
tccagctatg catgcagctt 
agtagctgca ctaacaaaca 
agacttttat gactttgctg 
aaaacacttc ttctttgctc 
ttataatctg ccaacaatgt 
taaatacttt gattgttacg 
tctggataaa tcagctggtt 
ctcaatgagt tatgaggatc 
tactataact caaatgaatc 
agctggtgtc tctatctgta 
gtcaatagcc gccactagag 
ctggcataat atgttaaaaa 
ggattatcca aaatgtgaca 
tcttgctcgc aaacataaca 
cgagtgtgcg caagtattaa 
aggtggaaca tcatccggtg 
tcaagctgtt acagccaatg 
caagtatgtc cgcaatctac 
tgatcatgaa ttcgtggatg 
tctttctgat gatgccgttg 
tagcattaag aactttaagg 
aaaatgttgg actgagactg 
aatgctagtt aaacaaggag 
attaggcgca ggctgttttg 


13920 
13980 

14040 
14100 
14160 
14220 
14280 
14340 
14400 
14460 
14520 
14580 
14640 
14700 
14760 
14820 
14880 
14940 
15000 
15060 
15120 
15180 
15240 
15300 
15360 
15420 
15480 
15540 
15600 
15660 
15720 
15780 
15840 
15900 


20 


25 


30 


35 


40 


45 


50 


55 


tcgatgatat 
ttgatgctta 
atttacaata 
ccgtaatgct 
tgtacacacc 
cttcacttcg 
accatgtcat 
ccccaggttg 
gcaagtcaca 
tatacaaaaa 
gtgattggac 
ttttcgcage 
ccactgtacg 
ctagaccacc 
aagtacagat 
gaggtactac 
taatgccact 
tgtacccaac 
tcggcatgca 
ccatcggact 
cagctgttga 
gaatcatacc 
tagaacagta 
tctttgatga 
gtgcaaaaca 
tgactaaagg 
taggtccaga 
tgagtgcttt 
tcaaaatgtt 
aaataggcgt 
tctcacctta 
ctgttgattc 
cagcacactc 


ttttgtgcat 


tgtcaaaaca 
cccacttaca 
cattagaaag 
aactaatgat 
acatacagtc 
ttgcggtgcc 
ttcaacatca 
tgatgtcact 
taagcctccc 
cacatgtgta 
taatgctggc 
agaaacgctc 
cgaagtactc 
attgaacaga 
tggagagtac 
gacatacaag 
tagtgcacct 
actcaacatc 
aaagtactct 
tgctctctat 
tgccctatgt 
tgcgcgtgcg 
tgttttctgc 
aatctctatg 
ctacgtctat 
cacactagaa 
catgttcctt 
agtttatgac 
ctacaaaggt 
tgtaagagaa 
taattcacag 
atcacagggt 
ttgtaatgtc 
aatgtctgat 
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gatggtacac 
aaacatccta 
ttacatgatg 
aacacctcac 
ttgcaggctg 
tgtattagga 
cacaaattag 
gatgtgacac 
attagttttc 
ggcagtgaca 
gattacatac 
aaagccactg 
tctgacagag 
aactatgtct 
acctttgaaa 
ttgaatgttg 
actctagtgc 
tcagatgagt 
acactccaag 
tacccatctg 
gaaaaggcat 
cgcgtagagt 
actgtaaatg 
gctactaatt 
attggcgatc 
ccagaatatt 
ggaacttgtc 
aataagctaa 
gttattacac 
tttcttacac 
aacgctgtag 
tctgaatatg 
aaccgcttca 


agagatcttt 


ttatgattga 
atcaggagta 
agcttactgg 
ggtactggga 
taggtgcttg 
gaccattcct 
tgttgtctgt 
aactgtatct 
cattatgtgc 
atgtcactga 
ttgccaacac 
aggaaacatt 
aattgcatct 
ttactggtta 
aaggtgacta 
gtgattactt 
cacaagagca 
tttctagcaa 
gaccacctgg 
ctcgcatagt 
taaaatattt 
gttttgataa 
cattgccaga 
atgacttgag 
ctgctcaatt 
ttaattcagt 
gccgttgtcc 
aagcacacaa 
atgatgtttc 
gcaatcctgc 
cttcaaaaat 
actatgtcat 
atgtggctat 


atgacaaact 


75 


aaggttcgtg 
tgctgatgtc 
ccacatgttg 
acctgagttt 
tgtattgtgc 
atgttgcaag 
taatccctat 
aggaggtatg 
taatggtcag 
cttcaatgcg 
ttgtactgag 
taagctgtca 
ttcatgggag 
ccgtgtaact 
tggtgatgct 
tgtgttgaca 
ctatgtgaga 
tgttgcaaat 
tactggtaag 
gtatacggca 
gcccatagat 
attcaaagtg 
aacaactgct 
tgttgtcaat 
accagccccc 
gtgcagactt 
tgctgaaatt 
ggataagtca 
atctgcaatc 
ttggagaaaa 
cttaggattg 
attcacacaa 
cacaagggca 


gcaatttaca 


tcactggcta 
tttcacttgt 
gacatgtatt 
tatgaggcta 
aattcacaga 
tgctgctatg 
gtttgcaatg 
agctattatt 
gtttttggtt 
atagcaacat 
agactcaagc 
tatggtattg 
gttggaaaac 
aaaaatagta 
gttgtgtaca 
tctcacactg 
attactggct 
tatcaaaagg 
agtcattttg 
tgctctcatg 
aaatgtagta 
aattcaacac 
gacattgtag 
gctagacttc 
cgcacattgc 
atgaaaacaa 
gttgacactg 
gctcaatgct 
aacagacctc 
gctgttttta 
cctacgcaga 
actactgaaa 
aaaattggca 


agtctagaaa 


15960 
16020 
16080 
16140 
16200 
16260 
16320 
16380 
16440 
16500 


_ 16560 


16620 
16680 
16740 
16800 
16860 
16920 
16980 
17040 
17100 
17160 
17220 
17280 
17340 
17400 
17460 
17520 
17580 
17640 
17700 
17760 
17820 
17880 
17940 


20 


25 


30 


35 


40 


45 


50 


55 


taccacgtcg 
gtagtaagat 
taaagttcaa 
accgtagact 
atatgtttat 
tagagggctg 
tttctacagg 
cagaattcac 
cactcatgta 
gtgatacact 
agcttacatc 
acaaacgtgc 
tgggttttga 
gtaaccttca 
gttgtgatgc 
attggtctgt 
aagtacaaca 
acattggaaa 
acgatgctca 
ctacacatca 
gttacccagc 
taccaggctg 
tcgataaaag 
cttgtgagtc 
ctacgtgtat 
accgacagta 
acaaacaatt 
atgtggctta 
tttccatcat 
aaaataagac 
aaccagtgcc 
taatctggga 
tgactgacat 


atggtagagt 


caatgtggct 
cattactggt 
gactgaagga 
catctctatg 
cacccgcgaa 
tcatgcaact 
tgttaactta 
cagagttaat 
taaaggcttg 
gaaaggattg 
aatgaagtac 
aacttgcttt 
ctatgtctat 
gagtaaccat 
tatcatgact 
tgaataccct 
catggttgtg 
tccaaaggct 
gccatgtagt 
cgataaattc 
caatgcaatt 
tgatggtggt 
tgcatttact 
tcatggcaaa 
tacacgatgc 
cttggatgca 
tgatacttat 
taatgttgtt 
taataatgct 
aacacttcct 
agagattaag 
ctacaaaaga 
tgccaagaaa 


ggaaggacag 
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acattacaag 
cttcatccta 
ttatgtgttg 
atgggtttca 
gaagctattc 
agagatgctg 
gtagctgtac 
gcaaaacctc 
ccctggaatg 
tcagacagag 
tttgtcaaga 
tctacttcat 
aacccattta 
gaccaacatt 
agatgtttag 
attataggag 
aagtctgcat 
atcaagtgtg 
gacaaagctt 
actgatggtg 
gtgtgtaggt 
agtttgtatg 
aatttaaagc 
caagtagtgt 
aatttaggtg 
tataatatga 
aacctgtgga 
aataaaggac 
gtttacacaa 
gttaatgttg 
atactcaata 
gaagccccag 
cctactgaga 


gtagaccttt 


Cagaaaatgt 
cacaggcacc 
acataccagg 
aaatgaatta 
gtcacgttcg 
tgggtactaa 
cgactggtta 
caccaggtga 
tagtgcgtat 
tcgtgttcgt 
ttggacctga 
cagatactta 
tgattgatgt 
gccaggtaca 
cagtccatga 
atgaactgag 
tgcttgctga 
tgcctcagge 
acaaaataga 
tttgtttgtt 
ttgacacaag 
tgaataagca 
aattgccttt 
cggatattga 
gtgctgtttg 
tgatttctgc 
atacatttac 
actttgatgg 
aggtagatgg 
catttgagct 
atttgggtgt 
cacatgtatc 
gtgcttgttc 


ttagaaacgc 


76 


aactggactt 
tacacacctc 
cataccaaag 
ccaagtcaat 
tgcgtggatt 
cctacctctc 
tgttgacact 
ccagtttaaa 
taagatagta 
cectttgggcg 
aagaacgtgt 
tgcctgctgg 
tcagcagtgg 
tggaaatgca 
gtgctttgtt 
ggttaattct 
taagtttcca 
tgaagtagaa 
ggaactcttc 
ttggaattgt 
agtcttgtca 
tgcattccac 
cttttactat 
ttatgttcca 
cagacaccat 
tggatttage 
caggttacag 
acacgccggc 
tattgatgtg 
ttgggctaag 
tgatatcgct 
tacaataggt 
ttcacttact 


ccgtaatggt 


tttaaggact 
agcgttgata 
gacatgacct 
ggttacccta 
ggctttgatg 
cagctaggat 
Gaaaataaca 
catcttatac 
Caaatgctca 
catggctttg 
tgtctgtgtg 
aatcattctg 
ggctttacgg 
catgtggcta 
aagcgcgttg 
gcttgcagaa 
gttcttcatg 
tggaagttct 
tattcttatg 
aacgttgatc 
aacttgaact 
actccagctt 
tctgatagtc 
ctcaaatctg 
gcaaatgagt 
ctatggattt 
agtttagaaa 
gaagcacctg 
gagatctttg 
cgtaacatta 
gctaatactg 
gtctgcacaa 
gtcttgtttg 
gttttaataa 


18000 
18060 
18120 
18180 
18240 
18300 
18360 
18420 
18480 
18540 
18600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 
19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
19920 
19980 


20 


25 


30 


35 


40 


45 


50 


55 


cagaaggttc 
gagtcacatt 
gcattattca 
agcccagatc 
gatataagct 
aacttggcgg 
aattagagga 
aaacaggttc 
agataataaa 
atgctgaaat 
aactacaagc 
aaagaatgct 
aaggaataat 
ctttagctgt 
ttgcaccagg 
cagatcttaa 
tacatacggc 
atgtgacaaa 
agcaaaaact 
ctgaccttta 
atgcatcatc 
aaattgatgg 
agttgtcttc 
ctgtaatgtc 
gtaggcttat 
actaaacgaa 
accggtgcac 
tgaggggggt 
atttatttct 
gcaaccctgt 
ttgtccgtgg 
ttaacaattc 
tetttgctgt 


ttaattgcac 


agtcaaaggt 
aattggagaa 
acagttgcct 
acaaatggaa 
cgagggctat 
tcttcattta 
ttttatccct 
atcaaaatgt 
gtcacaagat 
ttcattcatg 
aagtcaagcg 
tcttgaaaag 
gatgaatgtc 
accctacaac 
tacagctgtg 
tgacttcgtc 
taataaatgg 
agagaatgac 
agccctgggt 
caagcttatg 
atcggaagca 
ctataccatg 
ctattcactc 
tcttaaggag 
cattagagaa 
catgtttatt 
cacttttgat 
ttactatcct 
tccattttat 
catacctttt 
ttgggttttt 
tactaatgtt 
ttctaaaccc 


tttcgagtac 
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ctaacacctt 
tcagtaaaaa 
gaaacctact 
actgactttc 
gccttcgaac 
atgataggct 
atggacagca 
gtgtgttctg 
ttgtcagtga 
ctttggtgta 
tggcaaccag 
tgtgaccttc 
gcaaagtata 
atgagagtta 
ctcagacaat 
tccgacgcag 
gaccttatta 
tctaaagaag 
ggttctatag 
ggccatttct 
tttttaattg 
catgctaact 
tttgacatga 
aatcaaatca 
aacaacagag 
ttcttattat 
gatgttcaag 
gatgaaattt 
tctaatgtta 
aaggatggta 
ggttctacca 
gttatacgag 
atgggtacac 
atatctgatg 


Caaagggacc 
cacagtttaa 
ttactcagag 
tcgagctcgc 
acatcgttta 
tagccaagcg 
Ccagtgaaaaa 
tgattgatct 
tttcaaaagt 
aggatggaca 
gtgttgcgat 
agaattatgg 
ctcaactgtg 
ttcactttgg 
ggttgccaac 
attctacttt 
ttagcgatat 
ggtttttcac 
ctgtaaagat 
catggtggac 
gggctaacta 
acattttctg 
gcaaatttcc 
atgatatgat 
ttgtggtttc 
ttcttactct 
ctcctaatta 
ttagatcaga 
cagggtttca 
tttattttgc 
tgaacaacaa 
catgtaactt 
agacacatac 


ccttttcgcet 


77 


agcacaagct 
ctactttaag 
cagagactta 
tatggatgaa 
tggagatttc 
ctcacaagat 
ttacttcata 
tttacttgat 
ggtcaaggtt 
tgttgaaacc 
gcctaacttg 
tgaaaatgct 
tcaatactta 
tgctggctct 
tggcacacta 
aattggagac 
gtatgaccct 
ttatctgtgt 
aacagagcat 
agcttttgtt 
tcttggcaag 
gaggaacaca 
tcttaaatta 
ttattctctt 
aagtgatatt 
cactagtggt 
cactcaacat 
cactctttat 
tactattaat 
tgccacagag 
gtcacagtcg 
tgaattgtgt 
tatgatattc 
tgatgtttca 


agcgtcaatg 
aaagtagacg 
gaggatttta 
ttcatacagc 
agtcatggac 
tcaccactta 
acagatgcgc 
gactttgtcg 
acaattgact 
ttctacccaa 
tacaagatgc 
gttataccaa 
aatacactta 
gataaaggag 
cttgtcgatt 
tgtgcaacag 
aggaccaaac 
ggatttataa 
tcttggaatg 
acaaatgtaa 
ccgaaggaac 
aatcctatcc 
agaggaactg 
ctggaaaaag 
cttgttaaca 
agtgaccttg 
acttcatcta 
ttaactcagg 
catacgtttg 
aaatcaaatg 
gtgattatta 
gacaaccctt 
gataatgcat 


gaaaagtcag 


20040 
20100 
20160 
20220 
20280 
20340 
20400 
20460 
20520 
20580 
20640 
20700 
20760 
20820 
20880 
20940 
21000 
21060 
21120 
21180 
21240 
21300 
21360 
21420 
21480 
21540 
21600 
21660 
21720 
21780 
21840 
21900 
21960 
22020 


20 


25 


30 


35 


40 


45 


50 


55 


gtaattttaa 
ataagggcta 
aacctatttt 
ccttttcacc 
taaagccaac 
attgttctca 
aaggaattta 
ctaatattac 
tctatgcatg 
actcaacatt 
tttgcttctec 
tagcgccagg 
tgggttgtgt 
attataaata 
atgtgccttt 
cattaaatga 
tagtactttc 
ctgaccttat 
tgttaactcc 
atttcactga 
cttttggggg 
tatatcaaga 
cagcttggcg 
taggagctga 
gtgctagtta 
atactatgtc 
ctactaactt 
ccgtagattg 
aatatggtag 
atcgcaacac 
aatattttgg 
ggtcttttat 
agcaatatgg 


tcaatggact 


acacttacga 
tcaacctata 
taagttgcct 
tgctcaagac 
tacatttatg 
aaatccactt 
ccagacctct 
aaacttgtgt 
ggagagaaaa 
tTttttcaacc 
caatgtctat 
acaaactggt 
ccttgcttgg 
taggtatctt 
ctcccctgat 
ttatggtttt 
ttttgaactt 
taagaaccag 
ttcttcaaag 
ttccgttcga 
tgtaagtgta 
tgttaactgc 
catatattct 
gcatgtcgac 
ccatacagtt 
tttaggtgct 
ttcaattagce 
taatatgtac 
cttttgcaca 
acgtgaagtg 
tggttttaat 
tgaggacttg 
cgaatgccta 


tacagtgttg 
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gagtttgtgt 
gatgtagttc 
cttggtatta 
atttggggca 
ctcaagtatg 
gctgaactca 
aatttcaggg 
ccttttggag 
aaaatttcta 
tttaagtgct 
gcagattctt 
gttattgctg 
aatactagga 
agacatggca 
ggcaaacctt 
tacaccacta 
ttaaatgcac 
tgtgtcaatt 
agatttcaac 
gatcctaaaa 
attacacctg 
actgatgttt 
actggaaaca 
acttcttatg 
tctttattac 
gatagttcaa 
attactacag 
atctgcggag 
caactaaatc 
ttcgctcaag 
ttttcacaaa 
ctctttaata 
ggtgatatta 


ccacctctgc 


ttaaaaataa 
gtgatctacc 
acattacaaa 
cgtcagctgc 
atgaaaatgg 
aatgctctgt 
ttgttccctc 
aggtttttaa 
attgtgttgc 
atggcgtttc 
ttgtagtcaa 
attataatta 
acattgatgc 
agcttaggcc 
gcaccccacc 
ctggcattgg 
cggccacggt 
ttaattttaa 
catttcaaca 
catctgaaat 
gaacaaatgc 
ctacagcaat 
atgtattcca 
agtgcgacat 
gtagtactag 
ttgcttactc 
aagtaatgcc 
attctactga 
gtgcactctc 
tcaaacaaat 
tattacctga 
aggtgacact 
atgctagaga 
tcactgatga 


78 


agatgggttt 
ttctggtttt 
ttttagagcc 
agcctatttt 
tacaatcaca 
taagagcttt 
aggagatgtt 
tgctactaaa 
tgattactct 
tgccactaag 
gggagatgat 
taaattgcca 
tacttcaact 
ctttgagaga 
tgctcttaat 
ctaccaacct 
ttgtggacca 
tggactcact 
atttggccgt 
attagacatt 
ttcatctgaa 
tcatgcagat 
gactcaagca 
tcctattgga 
ccaaaaatct 
taataacacc 
tgtttctatg 
atgtgctaat 
aggtattgct 
gtacaaaacc 
ccctctaaag 
cgctgatgct 
tctcatttgt 
tatgattgct 


ctctatgttt 
aacactttga 
attcttacag 
gttggctatt 
gatgctgttg 
gagattgaca 
gtgagattcc 
ttcccttctg 
gtgctctaca 
ttgaatgatc 
gtaagacaaa 
gatgatttca 
ggtaattata 
gacatatcta 
tgttattggc 
tacagagttg 
aaattatcca 
ggtactggtg 
gatgtttctg 
tcaccttgct 
gttgctgttc 
caactcacac 
ggctgtctta 
gctggcattt 
attgtggctt 
attgctatac 
gctaaaacct 
ttgcttctcc 
gctgaacagg 
ccaactttga 
ccaactaaga 
ggcttcatga 
gcgcagaagt 


gcctacactg 


22080 
22140 
22200 
22260 
22320 
22380 
22440 
22500 
22560 
22620 
22680 
22740 
22800 
22860 
22920 
22980 
23040 
23100 
23160 
23220 
23280 
23340 
23400 
23460 
23520 
23580 
23640 
23700 
23760 
23820 
23880 
23940 
24000 
24060 


20 


25 


30 


35 


40 


45 


50 
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ctgctctagt 
aaataccttt 
ttctctatga 
aagaatcact 
atgctcaagc 
gtgtgctaaa 
ggttaattac 
ctgctgaaat 
gacaatcaaa 
cagccccgca 
tcaccacagc 
ttgtgtttaa 
ttactacaga 
acacagttta 
acttcaaaaa 
ctgtcgtcaa 
aatcactcat 
atgtttggct 
gttgcatgac 
agtttgatga 
cgaacttatg 
aaaaattgac 
agcctcactc 
cgctaccaaa 
gttcatttgc 
tgcaggtatg 
caacgcatgt 
attactttat 
accatataac 
aaaactcaaa 
agactatgtc 
aattactaca 
agacccaccg 


aatggatcca 


tagtggtact 
tgctatgcaa 
gaaccaaaaa 
tacaacaaca 
attaaacaca 
tgatatcctt 
aggcagactt 
cagggcttct 
aagagttgac 
tggtgttgtc 
gccagcaatt 
tggcacttct 
caatacattt 
tgatcctctg 
tcatacatca 
cattcaaaaa 
tgaccttcaa 
cggcttcatt 
tagttgttgc 
ggatgactct 
gatttgttta 
aatgcttctc 
cctttcggat 
ataattgcgc 
aatttactgc 
gaggcgcaat 
agaattatta 
gatgccaact 
agtgtcacag 
gaagactacc 
gttgtacatg 
gacactggta 
aatgtgcaaa 


atttatgatg 
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gccactgctg 
atggcatata 
caaatcgcca 
tcaactgcat 
cttgttaaac 
tcgcgacttg 
caaagccttc 
gctaatcttg 
ttttgtggaa 
ttcctacatg 
tgtcatgaag 
tggtttatta 
gtctcaggaa 
caacctgagc 
ccagatgttg 
gaaattgacc 
gaattgggaa 
gctggactaa 
agttgcctca 
gagccagttc 
tgagattttt 
ctgcaagtac 
ggcttgttat 
tcaataaaag 
tgctatttgt 
ttttgtacct 
tgagatgttg 
actttgtttg 
atacaattgt 
aaattggtgg 
gctatttcac 
ttgaaaatgce 
tacacacaat 


agccgacgac 


gatggacatt 
ggttcaatgg 
accaatttaa 
tgggcaagct 
aacttagctc 
ataaagtcga 
aaacctatgt 
ctgctactaa 
agggctacca 
tcacgtatgt 
gcaaagcata 
cacagaggaa 
attgtgatgt 
ttgactcatt 
atcttggcga 
gcctcaatga 
aatatgagca 
ttgccatcgt 
agggtgcatg 
tcaagggtgt 
tactcttgga 
tgttcatgct 
tggcgttgca 
atggcagcta 
taccatctat 
ctatgccttg 
gctttgttgg 
ctggcacaca 
cgttactgaa 
ttattctgag 
cgaagtttac 
tacattcttc 


cgacggctct 


gactactagc 


79 


tggtgctggc 
cattggagtt 
caaggcgatt 
gcaagacgtt 
taattttggt 
ggcggaggta 
aacacaacaa 
aatgtctgag 
ccttatgtcc 
gccatcccag 
cttccctcgt 
cttcttttct 
cgttattgge 
caaagaagag 
catttcaggc 
ggtcgctaaa 
atatattaaa 
catggttaca 
ctcttgtggt 
Ccaaattacat 
tcaattactg 
acagcaacga 
tttcttgctg 
gccctttata 
tcacatcttt 
atatattttc 
aagtgcaaat 
cataactatg 
ggtgacggca 
gataggcact 
taccagcttg 
atctttaaca 
tcaggagttg 
gtgcctttgt 


gctgctcttc 
acccaaaatg 
agtcaaattc 
gttaaccaga 
gcaatttcaa 
Caaattgaca 
ctaatcaggg 
tgtgttcttg 
ttcccacaag 
gagaggaact 
gaaggtgttt 
ccacaaataa 
atcattaaca 
ctggacaagt 
attaacgctt 
aatttaaatg 
tggccttggt 
atcttgcttt 
tcttgctgca 
tacacataaa 
cacagccagt 
taccgctaca 
tttttcagag 
agggcttcca 
tgcttgtcgc 
tacaatgcat 
ccaagaaccc 
actactgtat 
tttcaacacc 
caggtgttaa 
agtctacaca 
agcttgttaa 
ctaatccagc 


aagcacaaga 


24120 
24180 
24240 
24300 
24360 
24420 
24480 
24540 
24600 
24660 
24720 
24780 
24840 
24900 
24960 
25020 
25080 
25140 
25200 
25260 
25320 
25380 
25440 
25500 
25560 
25620 
25680 
25740 
25800 
25860 
25920 
25980 
26040 
26100 


20 


25 


30 


35 


40 


45 


50 
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aagtgagtac 
tagcgtactt 
tgcgcttcga 
ggtttacgtc 
ggtctaaacg 
gcagacaacg 
gtaataggtt 
aacaggtttt 
gcttgttttg 
gcaatggctt 
tttgctcgta 
cctctccggg 
gtgatcattc 
gacctgccaa 
gcgtcgcagc 
aactataaat 
taagtgacaa 
tatcattatg 
agtgagacaa 
acctatggag 
ttgtatttac 
tactaaaaga 
ctgacaataa 
gtactcgaca 
aagaggaggt 
ttttaatact 
cttctatttg 
ttggttttca 
gaaacttctc 
gcgctgtgca 
gtaatactta 
ggcacactat 
gtggtgcgct 
gagacgtact 


gaacttatgt 
ctttttcttg 
ttgtgtgcgt 
tactcgcgtg 
aactaactat 
gtactattac 
tectattcct 
tgtacataat 
tgcttgctgc 
gtattgtagg 
cccgctcaat 
ggacaattgt 
gtggtcactt 
aagagatcac 
gtgtaggcac 
taaatacaga 
cagatgtttc 
aggactttca 
ttatttaage 
ttagattatc 
atcttgcgag 
accttgccca 
atttgcacta 
tacctatcag 
tcaacaagag 
ttgcttcacc 
tgctttttag 
ctcgaaatcc 
attgttttga 
tctaataaac 
tagcactgct 
ggttcaaaca 
tatagctagg 
tgttgtttta 
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actcattcgt 
ctttcgtggt 
actgctgcaa 
ttaaaaatct 
tattattatt 
cgttgaggag 
agcctggatt 
aaagcttgtt 
tgtctacaga 
cttgatgtgg 
gtggtcattc 
gaccagaccg 
gcgaatggcc 
tgtggctaca 
tgattcaggt 
ccacgccggt 
atcttgttga 
ggattgctat 
ctctaactaa 
cataaaacga 
ctatatcact 
tcaggaacat 
acttgcacta 
ctgcgotgcaa 
ctctactcgc 
attaagagaa 
cctttctgct 
aggatctaga 
cttgtattte 
ctcatgtgct 
tggctttgtg 
tgcacaccta 
tgttggtacc 


aataaacgaa 


ttcggaagaa 
attcttgcta 
tattgttaac 
gaactcttct 
ctgtttggaa 
cttaaacaac 
atgttactac 
ttcctctggc 
attaattggg 
cttagctact 
aacccagaaa 
ctcatggaaa 
ggacactccc 
tcacgaacgc 
tttgctgcat 
agcaacgaca 
cttccaggtt 
ttggaatctt 
gaagaattat 
acatgaaaat 
atcaggagtg 
acgagggcaa 
gcacacactt 
gatcagtttc 
cactttttct 
agacagaatg 
attccttgtt 
agaaccttgt 
tctatgcagt 
tgaagatcct 
ctctaggaaa 
atgttactat 
ttcatgaagg 


Caaattaaaa 


80 


acaggtacgt 
gtcacactag 
gtgagtttag 
gaaggagttc 
ctttaacatt 
tcctggaaca 
aatttgccta 
tcttgtggcc 
tgactggcgg 
tcgttgcttc 
caaacattct 
gtgaacttgt 
tagggcgctg 
tttcttatta 
acaaccgcta 
atattgcttt 
acaatagcag 
gacgttataa 
tcggagttag 
tattctcttc 
tgttagaggt 
ttcaccattt 
tgcttttgct 
accaaaactt 
cattgttgct 
aatgagctca 
ttaataatgc 
accaaagtct 
tgcatatgca 
tgtaaggtac 
ggttttacct 
caactgtcaa 
tcaccaaact 


tgtctgataa 


taatagttaa 
ccatccttac 
taaaaccaac 
ctgatcttct 
gcttatcatg 
atggaaccta 
ttctaatcgg 
agtaacactt 
gattgcgatt 
cttcaggctg 
tctcaatgtg 
cattggtgct 
tgacattaag 
caaattagga 
cegtattgga 
gctagtacag 


agatattgat 


taagttcaat 
atgatgaaga 
ctgacattga 
acgactgtac 
caccctcttg 
tgtgctgacg 
ttcatcagac 
gctctagtat 
ctttaattga 
ttattatatt 
aaacgaacat 
ctgtagtaca 
aacactaggg 
tttcatagat 
gatccagctg 
gctgcattta 


tggaccccaa 


26160 
26220 
26280 
26340 
26400 
26460 
26520 
26580 
26640 
26700 
26760 
26820 
26880 
26940 
27000 
27060 
27120 
27180 
27240 
27300 
27360 
27420 
27480 
27540 
27600 
27660 
27720 
27780 
27840 
27900 
27960 
28020 
28080 
28140 


20 


25 


30 


35 


40 


45 


50 
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tcaaaccaac 
aaccagaatg 
aataatactg 
cctcgaggcc 
taccgaagag 
agatggtact 
aaagaaggca 
ggcacccgca 
ttgccaaaag 
tcatcacgta 
cctgctcgaa 
ttgaaccage 
actaagaaat 
cagtacaacg 
ggggaccaag 
tttgctccaa 
tcgggaacat 
aaagacaacg 
gagcctaaaa 
aagaagcagc 
cttcaaaatt 
accacacaag 
tactcttgtg 
atctcacata 
cattttcatc 
ctgcctatat 
attttaatag 


<210> 2 
<211> 3945 
<212> DNA 


gtagtgcccc 
gaggacgcaa 
cgtcttggtt 
agggcgttcc 
ctacccgacg 
tctattacct 
tcgtatgggt 
atcctaataa 
gcttctacgc 
gtcgcggtaa 
tggctagcgg 
ttgagagcaa 
ctgctgctga 
tcactcaagc 
acctaatcag 
gtgcctctgc 
ggctgactta 
tcatactgct 
aggacaaaaa 
ccactgtgac 
ccatgagtgg 
gcagatggge 
cagaatgaat 
gcaatcttta 
gaggccacgc 
ggaagagccc 


cttcttagga 


<213> CORONAVIRUS 


<220> 
<221> CDS 


<222> (89)..(3853) 


<223> 


<400> 2 
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ccgcattaca 
tggggcaagg 
cacagctctc 
aatcaacacc 
agttcgtggt 
aggaactggc 
tgcaactgag 
caatgctgcc 
agagggaagc 
ttcaagaaat 
aggtggtgaa 
agtttctggt 
ggcatctaaa 
atttgggaga 
acaaggaact 
attctttgga 
tcatggagec 
gaacaagcac 
gaaaaagact 
tcettcttcct 
agcttctgcet 
tatgtaaacg 
tctcgtaact 
atcaatgtgt 
ggagtacgat 
taatgtgtaa 


gaatgacaaa 


tttggtggac 
cCaaaacagc 
actcagcatg 
aatagtggtc 
ggtgacggca 
ccagaagctt 
ggagccttga 
accgtgctac 
agaggcggca 
tcaactcctg 
actgccctcg 
aaaggccaac 
aagectcgce 
cgtggtccag 
gattacaaac 
atgtcacgca 


attaaattgg 


attgacgcat 


gatgaagctc 
gcggctgaca 
gattcaactc 
ttttcgcaat 
aaacagcaca 
aacattaggg 
cgagggtaca 
aattaatttt 


aaaaaaaaaa 


81 


ccacagattc 
gccgacccca 
gcaaggagga 
cagatgacca 
aaatgaaaga 
cacttcccta 
atacacccaa 
aacttcctca 
gtcaagectc 
gcagcagtag 
cgctattgcet 
aacaacaagg 
aaaaacgtac 
aacaaaccca 
attggccgca 
ttggcatgga 
atgacaaaga 
acaaaacatt 
agcctttgcc 
tggatgattt 
aggcataaac 
tecgtttacg 
agtaggttta 
aggacttgaa 
gtgaataatg 
agtagtgcta 


aaaaaa 


aactgacaat 
aggtttaccc 
acttagattc 
aattggctac 
gctcagcecc 
cggcgctaac 
agaccacatt 
aggaacaaca 
ttctcgctcc 
gggaaattct 
gctagacaga 
ccaaactgtc 
tgccacaaaa 
aggaaatttc 
aattgcacaa 
agtcacacct 
tccacaattc 
cccaccaaca 
gcagagacaa 
ctccagacaa 
actcatgatg 
atacatagtc 
gttaacttta 
agagccacca 
ctagggagag 
tccccatgtg 


28200 
28260 
28320 
28380 
28440 
28500 
28560 
28620 
28680 
28740 
28800 
28860 
28920 
28980 
29040 
29100 
29160 
29220 
29280 
29340 
29400 
29460 
29520 
29580 
29640 
29700 
29746 
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35 
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45 


50 
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ttctcttctg gaaaaaggta ggcttatcat tagagaaaac aacagagttg tggtttcaag 


EP 1 694 829 B1 


tgatattctt gttaacaact aaacgaac atg ttt att ttc tta tta ttt ctt 


act 
Thr 


gtt 
Val 
25 


tac 
Tyr 


gat 
ASP 


aat 
Asn 


ttt 
Phe 


tct 
Ser 
105 


act 
Thr 


ttc 
Phe 


ttc 
Phe 


tcg 
Ser 


ttt 
Phe 
185 


Caa 
Gin 


aaa 


ctc 
Leu 
10 


caa 
Glin 


tat 
Tyr 


tta 
Leu 


cat 
His 


gct 
Ala 
90 


acc 
Thr 


aat 
Asn 


ttt 
Phe 


gat 
Asp 


ctt 
Leu 
170 


gt 
Va 


cct 
Pro 


ect 


act 
Thr 


gct 
Ala 


cct 
Pro 


ttt 
Phe 


acg 
Thr 
75 


gcc 
Ala 


atg 
Met 


gtt 
Val 


gct 
Ala 


aat 
Asn 
155 


gat 
Asp 


ttt 
Phe 


ata 
Tle 


att 


agt 
Ser 


cct 
Pro 


gat 
Asp 


ctt 
Leu 
60 


ttt 
Phe 


aca 
Thr 


aac 
Asn 


gtt 
val 


gtt 
Val 
140 


gca 
Ala 


gtt 
Val 


daa 
Lys 


gat 
Asp 


ttt 


ggt 
Gly 


aat 
Asn 


gaa 
Glu 
45 


cca 
Pro 


Gly 


gag 
Glu 


aac 
Asn 


ata 
Tle 
125 
tct 
Ser 


ttt 
Phe 


tca 
ser 


aat 
Asn 


gta 
205 


aag 


agt 
ser 


tac 
Tyr 
30 


att 
Ile 


ttt 
Phe 


aac 
Asn 


aaa 
Lys 


aag 
Lys 
110 


cga 
Arg 


dda 
Lys 


aat 
Asn 


gaa 
Glu 


aaa 
Lys 
190 


gtt 
val 


ttg 


gac 
Asp 
15 


act 
Thr 


ttt 
Phe 


tat 
Tyr 


cct 
Pro 


tca 
ser 
95 


tca 
ser 


gca 
Ala 


ccc 
Pro 


tgc 
cys 


aag 
Lys 
175 


gat 
Asp 


cgt 
Arg 


cct 


ctt 
Leu 


caa 
Gin 


aga 
Arg 


tct 
ser 


gtc 
Val 
80 


aat 
Asn 


cag 
Gin 


tgt 
cys 


atg 
Met 


act 
Thr 
160 


tca 
ser 


aly 


gat 
Asp 


ctt 


gac 
Asp 


cat 
H1Ss 


tca 
ser 


aat 
Asn 
65 

ata 
Ile 


gtt 
Val 


tcg 
ser 


aac 
Asn 


ety 
145 


ttc 
Phe 


aly 


ttt 
Phe 


cta 
Leu 


ggt 


cgg 
Arg 


act 
Thr 


gac 
Asp 
50 


gtt 
Val 


cct 
Pro 


gtc 
val 


gt 
va 


ttt 
Phe 
130 


aca 
Thr 


gag 
Glu 


aat 
Asn 


ctc 
Leu 


cct 
Pro 
210 


att 


82 


tgc 
cys 


tca 
Ser 
35 


act 
Thr 


aca 
Thr 


ttt 
Phe 


cgt 
Arg 


att 
Ile 
115 


gaa 
Glu 


cag 
Glin 


tac 
Tyr 


ttt 
Phe 


tat 
Tyr 
195 


tct 
ser 


aac 


acc 
Thr 
20 


tct 
ser 


ctt 
Leu 


ety 


aag 
Lys 


ggt 
Gly 
100 


att 
Ile 


ttg 
Leu 


aca 
Thr 


ata 
Ile 


aaa 
Lys 
180 


gtt 
val 


ety 


att 


act 
Thr 


atg 
Met 


tat 
Tyr 


ttt 
Phe 


gat 
Asp 
85 


tgg 
Trp 


att 
Ile 


tgt 
cys 


cat 
His 


tct 
ser 
165 


cac 
His 


tat 
Tyr 


ttt 
Phe 


aca 


ttt 
Phe 


agg 
Arg 


tta 
Leu 


cat 
His 
70 


aty 


gtt 
val 


aac 
Asn 


gac 
Asp 


act 
Thr 
150 


gat 
Asp 


tta 
Leu 


aag 
Lys 


aac 
Asn 


aat 


gat 
Asp 


aly 


act 
Thr 
55 


act 
Thr 


att 
Tle 


ttt 
Phe 


aat 
Asn 


aac 
Asn 
135 


atg 
Met 


gcc 
Ala 


cga 
Arg 


ty 


act 
Thr 
215 


ttt 


=e Phe Ile Phe Leu Leu Phe Leu 
5 


gat 
Asp 


gtt 
Val 
40 


cag 
Gin 


att 
Tle 


tat 
Tyr 


éty 


tct 
ser 
120 


cct 
Pro 


ata 
Tle 


ttt 
Phe 


gag 
Glu 


tat 
Tyr 
200 


ttg 
Leu 


aga 


60 
112 


160 


208 


256 


304 


352 


400 


448 


496 


544 


592 


640 


688 


736 


784 


20 


25 


30 


35 


40 


45 


50 


55 


Lys 


gcc 
Ala 


gct 
Ala 


aag 
Lys 
265 


aat 
Asn 


aaa 
Lys 


gtt 
val 


ttt 
Phe 


att 
Ile 
345 


ttt 
Phe 


ctt 
Leu 


gat 
Asp 


aat 
Asn 


act 
Thr 
425 


agg 
Arg 


aat 
Asn 


aat 
Asn 


att 


Pro 


att 
Ile 


gca 
Ala 
250 


tat 
Tyr 


cca 
Pro 


gga 
Gly 


gt 
Va 


aat 
Asn 
330 


tct 
ser 


tca 
ser 


tgc 
cys 


gta 
Val 


tat 
Tyr 
410 


agg 
Arg 


tat 
Tyr 


gt 
Va 


tgt 
cys 


ggc 


Ile 


ctt 
Leu 
235 


gcc 
Ala 


gat 
Asp 


ctt 
Leu 


att 
Ile 


aga 
Arg 
315 


gct 
Ala 


aat 
Asn 


acc 
Thr 


ttc 
Phe 


aga 
Arg 
395 


aaa 
Lys 


aac 
Asn 


ctt 
Leu 


cct 
Pro 


tat 
Tyr 
475 


tac 


Phe 
220 


aca 
Thr 


tat 
Tyr 


gaa 
Glu 


gct 
Ala 


tac 
Tyr 
300 


ttc 
Phe 


act 
Thr 


tgt 
cys 


ttt 
Phe 


tcc 
ser 
380 


caa 
GIn 


ttg 
Leu 


att 
Tle 


aga 
Arg 


ttc 
Phe 
460 


tgg 
Trp 


Ccaa 


Lys 


gcc 
Ala 


ttt 
Phe 


aat 
Asn 


gaa 
Glu 
285 


cag 
Gin 


cct 
Pro 


aaa 
Lys 


gtt 
val 


aag 
Lys 
365 


aat 
Asn 


ata 
Ile 


cca 
Pro 


gat 
ASp 


cat 
His 
445 


tcc 
ser 


cca 
Pro 


cect 


Leu 
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His 
Ser 
165 
His 
Tyr 


Phe 


Thr 


Leu 


Phe 


Arg 


Leu 


His 


70 


Gly 


Val 


Asn 


Asp 


Thr 


150 


Asp 


Leu 


Lys 


Asn 


Asn 
230 
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Phe 
Asp 
Gly 
Thr 
55 

Thr 
Ile 
Phe 
Asn 
Asn 
135 
Met 
Ala 
Arg 
Gly 
Thr 


215 


Phe 


Leu 


Asp 


Val 


40 


Gln 


Tle 


Tyr 


Gly 


ser 


120 


Pro 


Ile 


Phe 


Glu 


Tyr 


200 


Leu 


Arg 


Thr 


val 


25 


Tyr 


Asp 


Asn 


Phe 


ser 


105 


Thr 


Phe 


Phe 


ser 


Phe 


185 


GIn 


Lys 


Ala 


87 


Leu 


10 


GlIn 


Tyr 


Leu 


His 


Ala 


90 


Thr 


Asn 


Phe 


Asp 


Leu 


170 


val 


Pro 


Pro 


Ile 


Thr 


Ala 


Pro 


Phe 


Thr 


75 


Ala 


Met 


Val 


Ala 


Asn 


155 


Asp 


Phe 


Tle 


Ile 


Leu 
235 


ser 


Pro 


Asp 


Leu 


60 


Phe 


Thr 


Asn 


val 


val 


140 


Ala 


val 


Lys 


Asp 


Phe 


220 


Thr 


Gly 


Asn 


Glu 


45 


Pro 


Gly 


Glu 


Asn 


Lle 


ser 


Phe 


ser 


Asn 


val 


205 


Lys 


Ala 


ser 


Tyr 


30 


Tle 


Phe 


Asn 


Lys 


Lys 


Arg 


Lys 


Asn 


Glu 


Lys 


val 


Leu 


Phe 


Asp 


15 


Thr 


Phe 


Tyr 


Pro 


ser 


95 


ser 


Ala 


Pro 


cys 


Lys 


ASp 


Arg 


Pro 


ser 


Leu 


Gin 


Arg 


ser 


Val 


80 


Asn 


Gin 


cys 


Met 


Thr 


160 


ser 


Gly 


Asp 


Leu 


Pro 
240 


20 


25 


30 


35 


40 


45 


50 


55 


Ala 


Leu 


ser 


Phe 


305 


Asn 


val 


ser 


Val 


ASp 


385 


Met 


Thr 


Arg 


Tyr 


val 


Gln 


Lys 


Asp 


Val 


290 


Arg 


Leu 


Tyr 


val 


ser 


370 


ser 


Thr 


Gly 


Gly 


Pro 


450 


Pro 


Gly 


val 


Asp 


Pro 


Ala 


275 


Lys 


val 


cys 


Ala 


Leu 


355 


Ala 


Phe 


Gly 


cys 


Asn 


435 


Phe 


cys 


Phe 


Leu 


Tle 


Thr 


260 


val 


ser 


val 


Pro 


340 


Tyr 


Thr 


val 


Val 


val 


420 


Tyr 


Glu 


Thr 


Tyr 


ser 
500 


Trp 
Thr 
Asp 
Phe 
Pro 
Phe 
325 
Glu 
Asn 
Lys 
Val 
Tle 
405 
Leu 
Asn 
Arg 
Pro 
Thr 


485 


Phe 


Gly 


Phe 


cys 


Glu 


ser 


310 


Gly 


Arg 


ser 


Leu 


Lys 


Ala 


Ala 


Tyr 


Asp 


Pro 


470 


Thr 


Glu 
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Thr ser Ala 


Met 


ser 


Tle 


295 


Gly 


Glu 


Lys 


Thr 


Asn 


375 


Gly 


Asp 


Trp 


Lys 


Ile 


455 


Ala 


Thr 


Leu 


Leu 
Gin 
280 
ASp 
Asp 
val 
Lys 
Phe 
360 
ASp 
Asp 
Tyr 
Asn 
Tyr 
440 
Ser 
Leu 


Gly 


Leu 


Lys 


265 


Asn 


Lys 


val 


Phe 


Ile 


345 


Phe 


Leu 


Asp 


Asn 


Thr 


425 


Arg 


Asn 


Asn 


Tle 


Asn 
505 


88 


Ala 


250 


Tyr 


Pro 


Gly 


val 


Asn 


330 


ser 


ser 


cys 


Val 


Tyr 


410 


Arg 


Tyr 


val 


cys 


Gly 


Ala 


Ala 


ASp 


Leu 


Ile 


Arg 


315 


Ala 


Asn 


Thr 


Phe 


Arg 


395 


Lys 


Asn 


Leu 


Pro 


Tyr 


475 


Tyr 


Pro 


Tyr 


Glu 


Ala 


Tyr 


300 


Phe 


Thr 


cys 


Phe 


ser 


380 


Gin 


Leu 


Ile 


Arg 


Phe 


460 


Trp 


Gin 


Ala 


Phe 


Asn 


Glu 


285 


Gin 


Pro 


Lys 


Val 


Lys 


Asn 


Ile 


Pro 


Asp 


His 


445 


ser 


Pro 


Pro 


Thr 


val 


Gly 


Leu 


Thr 


Asn 


Phe 


Ala 


350 


cys 


val 


Ala 


Asp 


Ala 


430 


Gly 


Pro 


Leu 


Tyr 


val 
510 


Gly 


Thr 


Lys 


ser 


Tle 


Pro 


335 


ASp 


Tyr 


Tyr 


Pro 


Asp 


Thr 


Lys 


Asp 


Asn 


Arg 


cys 


Tyr 


Tle 


cys 


Asn 


Thr 


320 


ser 


Tyr 


Gly 


Ala 


Gly 


Phe 


ser 


Leu 


Gly 


Asp 


Val 


Gly 


20 


25 


30 


35 


40 


45 


50 


55 


Pro 
Phe 
Phe 
545 
ser 
Ser 
Glu 
Ala 
Gly 
His 
cys 
Ser 
tyr 
Thr 


705 


Asn 


Ala 


Gln 


Lys 


Asn 


530 


Gin 


Val 


Phe 


val 


Ile 


610 


Asn 


val 


Ala 


Ile 


ser 


690 


Thr 


Met 


Tyr 


Ala 


Met 
770 


Leu 


515 


Gly 


Pro 


Arg 


Gly 


Ala 


595 


His 


Asn 


Asp 


ser 


Val 


675 


Asn 


Glu 


Tyr 


Gly 


Glu 


Tyr 


ser 


Leu 


Phe 


ASp 


Gly 


580 


val 


Ala 


val 


Thr 


Tyr 


660 


Ala 


Asn 


Val 


Ile 


ser 


740 


GIn 


Lys 


Thr 


Thr 


Gin 


Pro 


565 


val 


Leu 


Asp 


Phe 


ser 


645 


His 


Tyr 


Thr 


Met 


cys 


725 


Phe 


Asp 


Thr 


Asp 


Gly 


Gln 


550 


Lys 


ser 


Tyr 


Gln 


Gin 


630 


Tyr 


Thr 


Thr 


Ile 


Pro 


710 


Gly 


cys 


Arg 


Pro 
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Leu 


Thr 


535 


Phe 


Thr 


val 


Gin 


Leu 


615 


Thr 


Glu 


Val 


Met 


Ala 


695 


val 


Asp 


Thr 


Asn 


Thr 
775 


Ile 


220 


Gly 


Gly 


ser 


Ile 


Asp 


Thr 


Gin 


cys 


ser 


ser 


680 


Ile 


ser 


ser 


Glin 


Thr 


760 


Leu 


Lys 


val 


Arg 


Glu 


Thr 


585 


val 


Pro 


Ala 


Asp 


Leu 


665 


Leu 


Pro 


Met 


Thr 


Leu 


745 


Arg 


Lys 


89 


Asn 


Leu 


Asp 


Tle 


570 


Pro 


Asn 


Ala 


Gly 


Ile 


650 


Leu 


Gly 


Thr 


Ala 


Glu 


730 


Asn 


Glu 


Tyr 


Gln 


Thr 


Val 


555 


Leu 


Gly 


cys 


Trp 


cys 


635 


Pro 


Arg 


Ala 


Asn 


Lys 


cys 


Arg 


Val 


Phe 


cys 


Pro 


540 


ser 


ASp 


Thr 


Thr 


Arg 


620 


Leu 


Ile 


Ser 


Asp 


Phe 


700 


Thr 


Ala 


Ala 


Phe 


Gly 


val 


525 


ser 


Asp 


Tle 


Asn 


Asp 


Ile 


Ile 


Gly 


Thr 


ser 


685 


ser 


ser 


Asn 


Leu 


Ala 


765 


Gly 


Asn 


ser 


Phe 


ser 


Ala 


590 


Val 


Tyr 


Gly 


Ala 


ser 


670 


ser 


Tle 


Val 


Leu 


ser 


750 


GIn 


Phe 


Phe 


Lys 


Thr 


Pro 


575 


ser 


ser 


ser 


Ala 


Gly 


Glin 


Ile 


ser 


Asp 


Leu 


735 


Gly 


Val 


Asn 


Asn 


Arg 


Asp 


560 


cys 


Ser 


Thr 


Thr 


Glu 


640 


Tle 


Lys 


Ala 


Tle 


cys 


720 


Leu 


Tle 


Lys 


Phe 


20 


25 


30 


35 


40 


45 


50 


55 


ser 


785 


Glu 


Lys 


Cys 


Asp 


Thr 


865 


Ala 


Val 


Tle 


Lys 


val 


945 


Asp 


Arg 


Gln 


Thr 


Phe 


Pro 


Gln 


Asp 


Gln 


Ala 


Asp 


Ala 


Met 


Leu 


ser 


Leu 


930 


Lys 


Tle 


Leu 


Leu 


Ile 


Leu 


Tyr 


Glin 


Met 


Gly 


Gln 


Tyr 


Gln 


915 


Gln 


Gln 


Leu 


Ile 


Ile 
995 


Leu 


Leu 


Gly 


Lys 


Tle 


Trp 


Met 


Glu 


900 


Tle 


Asp 


Leu 


ser 


Thr 


980 


Arg 


Pro 


Phe 


805 


Glu 


Phe 


Ala 


Thr 


Ala 


885 


Asn 


Gln 


val 


ser 


Arg 


Asp 


790 


Asn 


cys 


Asn 


Ala 


Phe 


870 


Tyr 


Gln 


Glu 


val 


ser 


950 


Leu 


965 . 


Gly 


Ala 


Arg 


Ala 
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Pro 


Lys 


Leu 


Gly 


Tyr 


855 


Gly 


Arg 


Lys 


ser 


Asn 


935 


Asn 


Asp 


Leu 


Glu 


Leu 


Val 


Gly 


Leu 


840 


Thr 


Ala 


Phe 


Gln 


Leu 


920 


Gin 


Phe 


Lys 


Gin 


Lys 


Thr 


Asp 


825 


Thr 


Ala 


Gly 


Asn 


Ile 


905 


Thr 


Asn 


Gly 


Val 


ser 
985 


Pro Thr 
795 


Leu Ala 


810 


Ile Asn 


val Leu 


Ala Leu 


Ala Ala 


875 


Gly Tle 


Ala Asn 


Thr Thr 


Ala Gln 


Ala Ile 


Glu Ala 


970 


Leu Glin 


Lys 


Asp 


Ala 


Pro 


val 


860 


Leu 


Gly 


Gin 


ser 


Ala 


940 


ser 


Glu 


Thr 


Arg 


Ala 


Arg 


Pro 


845 


ser 


Gin 


val 


Phe 


Thr 


925 


Leu 


ser 


val 


Tyr 


ser 


Gly 


Asp 


830 


Leu 


Gly 


Tle 


Thr 


Asn 


910 


Ala 


Asn 


Val 


Gln 


val 
990 


Phe 


Phe 


815 


Leu 


Leu 


Thr 


Pro 


Gin 


895 


Lys 


Leu 


Thr 


Leu 


Tle 


975 


Thr 


Tle 


800 


Met 


Tle 


Thr 


Ala 


Phe 


880 


Asn 


Ala 


Gly 


Leu 


Asn 


960 


Asp 


Gin 


Tle Arg Ala Ser Ala Asn Leu Ala Ala 
1000 


Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp 
1010 1015 1020 


cys 
1025 


Gly Lys Gly Tyr His 
1030 


Leu Met Ser Phe Pro Gln Ala Ala 
1035 


His Gly Val val Phe Leu. His Val Thr tyr val_ Pro Ser Gln 
1040 1045 1050 


90 


20 


25 


30 


35 


40 


45 


50 


55 


Glu Arg 
1055 


Ala Tyr 
1070 


Trp Phe 
1085 


Thr Asp 
1100 


Ile Ile 
1115 


Ser Phe 
1130 


Pro Asp 
1145 


Val Asn 
1160 


Asn Leu 
1175 


Glu Gln 
1190 


Ala Gl 


Met Thr 


ser Cys 


Gly val 
1250 


<210>4 
<211> 3943 
<212> DNA 


Asn 


Phe 


Tle 


Asn 


Asn 


Lys 


Val 


Ile 


Asn 


Tyr 


Leu 


ser 


cys 


Lys 


<213> CORONAVIRUS 


<400> 4 


Phe 


Pro 


Thr 


Thr 


Asn 


Glu 


Asp 


GIn 


Glu 


Tle 


Ile 


cys 


Lys 


Leu 


Thr 


Arg 


Gin 


Phe 


Thr 


Glu 


Leu 


Lys 


ser 


Lys 


Ala 


cys 


Phe 


His 


Thr 


Glu 


Arg 


val 


val 


Leu 


Gly 


Glu 


Leu 


Trp 


Ile 


ser 


Asp 


Tyr 
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Ala 
1060 


y 
1075 


Asn 
1090 


ser 
1105 


Tyr 
1120 


Asp 
1135 


Asp 
1150 


Ile 
1165 


Ile 
1180 


Pro 
1195 


Val 
1210 


cys 
1225 


Glu 
1240 


Thr 
1255 


Pro Ala Ile Cys 


val 


Phe 


Gly 


Asp 


Lys 


Ile 


Asp 


Asp 


Trp 


Met 


Leu 


Asp 


91 


Phe 


Phe 


Asn 


Pro 


Tyr 


ser 


Arg 


Leu 


Tyr 


val 


Lys 


Asp 


Val 


ser 


cys 


Leu 


Phe 


Gly 


Leu 


Glin 


Val 


Thr 


Gly 


ser 


Phe 


Pro 


Asp 


GIn 


Lys 


Ile 


Asn 


Glu 


Trp 


Tle 


Ala 


Glu 


His 
1065 


Asn 
1080 


Gin 
1095 


val 
1110 


Pro 
1125 


Asn 
1140 


Asn 
1155 


Glu 
1170 


Leu 
1185 


Leu 
1200 


Leu 
1215 


cys 
1230 


Pro 
1245 


Glu 


Gly 


Ile 


val 


Glu 


His 


Ala 


val 


Gly 


Gly 


Leu 


ser 


Val 


Gly 


Thr 


Ile 


Tle 


Leu 


Thr 


ser 


Ala 


Lys 


Phe 


cys 


cys 


Leu 


Lys 


ser 


Thr 


Gly 


Asp 


ser 


val 


Lys 


Tyr 


Ile 


cys 


Gly 


Lys 


20 


25 


30 


35 


40 


45 


50 


55 
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ctcttctgga aaaaggtagg cttatcatta gagaaaacaa cagagttgtg gtttcaagtg 


92 


60 


20 


25 


30 


35 


40 


45 


50 


55 


atattcttgt 
gtggtagtga 
aacatacttc 
tttatttaac 
ttaatcatac 
cagagaaatc 
agtcggtgat 
tgtgtgacaa 
tattcgataa 
tttcagaaaa 
ggtttctcta 
gttttaacac 
gagccattct 
attttgttgg 
tcacagatgc 
gctttgagat 
atgttgtgag 
ctaaattccc 
actctgtgct 
ctaagttgaa 
atgatgtaag 
tgccagatga 
caactggtaa 
agagagacat 
ttaattgtta 
aaccttacag 
gaccaaaatt 
tcactggtac 
gccgtgatgt 
acatttcacc 
ctgaagttgc 
cagatcaact 
aagcaggctg 
ttggagctgg 


taacaactaa 
ccttgaccgg 
atctatgagg 
tcaggattta 
gtttggcaac 
aaatgttgtc 
tattattaac 
cectttcttt 
tgcatttaat 
gtcaggtaat 
tgtttataag 
tttgaaacct 
tacagecttt 
ctatttaaag 
tgttgattgt 
tgacaaagga 
attccctaat 
ttctgtctat 
ctacaactca 
tgatctttgc 
acaaatagcg 
tttcatgggt 
ttataattat 
atctaatgtg 
ttggccatta 
agttgtagta 
atccactgac 
tggtgtgtta 
ctctgatttc 
ttgctctttt 
tgttctatat 
cacaccagct 
tcttatagga 
catttgtgct 
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acgaacatgt 
tgcaccactt 
ggqgtttact 
tttcttccat 
cctgtcatac 
cgtggttggg 
aattctacta 
gctgtttcta 
tgcactttcg 
tttaaacact 
ggctatcaac 
atttttaagt 
tcacctgctc 
ccaactacat 
tctcaaaatc 
atttaccaga 
attacaaact 
gcatgggaga 
acattttttt 
ttctccaatg 
ccaggacaaa 
tgtgtccttg 
aaatataggt 
cctttctcce 
aatgattatg 
ctttcttttg 
cttattaaga 
actccttctt 
actgattccg 
gggggtgtaa 
caagatgtta 
tqgcgcatat 
gctgagcatg 


agttaceata 


ttattttctt 
ttgatgatgt 
atcctgatga 
tttattctaa 
cttttaagga 
tttttggttc 
atgttgttat 
aacccatggg 
agtacatatc 
tacgagagtt 
ctatagatgt 
tgcctcttgg 
aagacatttg 
ttatgctcaa 
cacttgctga 
cctctaattt 
tgtgtccttt 
gaaaaaaaat 
caacctttaa 
tctatgcaga 
ctggtgttat 
cttggaatac 
atcttagaca 
ctgatggcaa 
gtttttacac 
aacttttaaa 
accagtgtgt 
caaagagatt 
ttcgagatcc 
gtgtaattac 
actgcactga 
attctactgg 
tcgacacttc 


cagtttcttt 


93 


attatttctt 
tcaagctcct 
aatttttaga 
tgttacaggg 
tggtatttat 
taccatgaac 
acgagcatgt 
tacacagaca 
tgatgccttt 
tgtgtttaaa 
agttcgtgat 
tattaacatt 
gggcacgtca 
gtatgatgaa 
actcaaatgc 
cagggttgtt 
tggagaggtt 
ttctaattgt 
gtgctatggc 
ttcttttgta 
tgctgattat 
taggaacatt 
tggcaagctt 
accttgcacc 
cactactggc 
tgcaccggcc 
caattttaat 
tcaaccattt 
taaaacatct 


acctggaaca 


tgtttctaca 


aaacaatgta 
ttatgagtgc 


attacgtagt 


actctcacta 
aattacactc 
tcagacactc 
tttcatacta 
tttgctgcca 
aacaagtcac 
aactttgaat 
catactatga 
tcegcttgatg 
aataaagatg 
ctaccttctg 
acaaatttta 
gctgcagect 
aatggtacaa 
tctgttaaga 
cectcaggag 
tttaatgcta 
gttgctgatt 
gtttctgcca 
gtcaagggag 
aattataaat 
gatgctactt 
aggccctttg 
ccacctgctc 
attggctacc 
acggtttgtg 
tttaatggac 
Caacaatttg 
gaaatattag 
aatgcttcat 
gcaatccatg 
ttccagactc 
gacattccta 


actagccaaa 


120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 


20 


25 


30 


35 


40 


45 


50 


55 


aatctattgt 
acaccattgc 
ctatggctaa 
ctaatttgct 
ttgctgctga 
aaaccccaac 
taaagccaac 
atgctggctt 
tttgtgcgca 
ttgctgccta 
ctggcgctgc 
gagttaccca 
cgattagtca 
acgttgttaa 
ttggtgcaat 
aggtacaaat 
aacaactaat 
ctgagtgtgt 
tgtccttccc 
cccaggagag 
ctcgtgaagg 
tttctccaca 
ttggcatcat 
aagagctgga 
caggcattaa 
ctaaaaattt 
ttaaatggcc 
ttacaatctt 
gtggttcttg 
tacattacac 
tactgcacag 
<210> 5 


<211> 2049 
<212> DNA 


ggcttatact 
tatacctact 
aacctccgta 
tctccaatat 
acaggatcgc 
tttgaaatat 
taagaggtct 
catgaagcaa 
gaagttcaat 
cactgctgct 
tcttcaaata 
aaatgttctc 
aattcaagaa 
ccagaatgct 
ttcaagtgtg 
tgacaggcta 
cagggctgct 
tcttggacaa 
acaagcagcc 
gaacttcacc 
tgtttttgtg 
aataattact 
taacaacaca 
caagtacttc 
cgcttctgtc 
aaatgaatca 
ttggtatgtt 
gctttgttgc 
ctgcaagttt 
ataaacgaac 


ccagtaaaaa 


<213> CORONAVIRUS 
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atgtctttag 
aacttttcaa 
gattgtaata 
ggtagctttt 
aacacacgtg 
tttggtggtt 
tttattgagg 
tatggcgaat 
gggcttacag 
ctagttagtg 
ecttttgcta 
tatgagaacc 
tcacttacaa 
caagcattaa 
ctaaatgata 
attacaggca 
gaaatcaggg 
tcaaaaagag 
ccgcatggtg 
acagcgccag 
tttaatggca 
acagacaata 
gtttatgatc 
aaaaatcata 
gtcaacattc 
ctcattgacc 
tggctcggct 
atgactagtt 
gatgaggatg 
ttatggattt 
ttgacaatgc 


gtgctgatag 
ttagcattac 
tgtacatctg 
gcacacaact 
aagtgttcgc 
ttaattttte 
acttgctctt 
gcctaggtga 
tgttgccacc 
gtactgccac 
tgcaaatggc 
aaaaacaaat 
caacatcaac 
acacacttgt 
tcctttcgcg 
gacttcaaag 
cttctgctaa 
ttgacttttg 
ttgtcttcct 
caatttgtca 
cttcttggtt 
catttgtctc 
ctctgcaacc 
catcaccaga 
aaaaagaaat 
ttcaagaatt 
tcattgctgg 
gttgcagttg 
actctgagcc 
gtttatgaga 


ttctcctgca 


94 


ttcaattgct 
tacagaagta 
cggagattct 
aaatcgtgca 
tcaagtcaaa 
acaaatatta 
taataaggtg 
tattaatgct 
tctgctcact 
tgctggatgg 
atataggttc 
cgccaaccaa 
tgcattgggc 
taaacaactt 
acttgataaa 
ccttcaaacc 
tcttgctgct 
tggaaagggc 
acatgtcacg 
tgaaggcaaa 
tattacacag 
aggaaattgt 
tgagcttgac 
tgttgatctt 
tgaccgcctc 
gggaaaatat 
actaattgcc 
cctcaagggt 
agttctcaag 
ttttttactc 


agt 


tactctaata 
atgcctgttt 
actgaatgtg 
ctctcaggta 
caaatgtaca 
cctgaccctc 
acactcgctg 
agagatctca 
gatgatatga 
acatttggtg 
aatggcattg 
tttaacaagg 
aagctgcaag 
agctctaatt 
gtcgaggcgg 
tatgtaacac 
actaaaatgt 
taccacctta 
tatgtgccat 
gcatacttcc 
aggaacttct 
gatgtcgtta 
tcattcaaag 
ggcgacattt 
aatgaggtcg 
gagcaatata 
atcgtcatgg 
gcatgctctt 
ggtgtcaaat 
ttggatcaat 


2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 
3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3943 


20 


25 


30 


35 


40 


45 


50 


55 


<400> 5 


ctcttctgga 
atattcttgt 
gtggtagtga 
aacatacttc 
tttatttaac 
ttaatcatac 
cagagaaatc 
agtcggtgat 
tgtgtgacaa 
tattcgataa 
tttcagaaaa 
ggtttctcta 
gttttaacac 
gagccattct 
attttgttgg 
tcacagatgc 
gctttgagat 
atgttgtgag 
ctaaattccc 
actctgtgct 
ctaagttgaa 
atgatgtaag 
tgccagatga 
caactggtaa 
agagagacat 
ttaattgtta 
aaccttacag 
gaccaaaatt 
tcactggtac 
gccgtgatgt 


acatttcacc 


aaaaggtagg 
taacaactaa 
ccttgaccgg 
atctatgagg 
tcaggattta 
gtttggcaac 
aaatgttgtc 
tattattaac 
cectttcttt 
tgcatttaat 
gtcaggtaat 
tgtttataag 
tttgaaacct 
tacagccttt 
ctatttaaag 
tgttgattgt 
tgacaaagga 
attccctaat 
ttctgtctat 
ctacaactca 
tgatctttgc 
acaaatagcg 
tttcatgggt 
ttataattat 
atctaatgtg 
ttggccatta 
agttgtagta 
atccactgac 
tggtgtgtta 
ctctgatttc 
ttgctctttt 


EP 1 694 829 B1 


cttatcatta 
acgaacatgt 
tgcaccactt 
ggggtttact 
tttcttccat 
cctgtcatac 
cgtggttggg 
aattctacta 
gctgtttcta 
tgcactttcg 
tttaaacact 
ggctatcaac 
atttttaagt 
tcacctgctc 
ccaactacat 
tctcaaaatc 
atttaccaga 
attacaaact 
gcatgggaga 
acattttttt 
ttctccaatg 
ccaggacaaa 
tgtgtccttg 
aaatataggt 
cectttctccc 
aatgattatg 
ctttcttttg 
cttattaaga 
actccttctt 
actgattccg 


gggggtgtaa 


gagaaaacaa 
ttattttctt 
ttgatgatgt 
atcctgatga 
tttattctaa 
cttttaagga 
tttttggttc 
atgttgttat 
aacccatggg 
agtacatatc 
tacgagagtt 
ctatagatgt 
tgcctcttgg 
aagacatttg 
ttatgctcaa 
cacttgctga 
cctctaattt 
tgtgtccttt 
gaaaaaaaat 
caacctttaa 
tctatgcaga 
ctggtgttat 
cttggaatac 
atcttagaca 
ctgatggcaa 
gtttttacac 
aacttttaaa 
accagtgtgt 
caaagagatt 
ttcgagatcc 
gtgtaattac 


95 


cagagttgtg 
attatttctt 
tcaagctcct 
aatttttaga 
tgttacaggg 
tggtatttat 
taccatgaac 
acgagcatgt 
tacacagaca 
tgatgccttt 
tgtgtttaaa 
agttcgtgat 
tattaacatt 
gggcacgtca 
gtatgatgaa 
actcaaatgc 
cagggttgtt 
tggagaggtt 
ttctaattgt 
gtgctatggc 
ttcttttgta 
tgctgattat 
taggaacatt 
tggcaagctt 
accttgcacc 
cactactggc 
tgcaccggcc 
caattttaat 
tcaaccattt 
taaaacatct 


acctggaaca 


gtttcaagtg 
actctcacta 
aattacactc 
tcagacactc 
tttcatacta 
tttgctgcca 
aacaagtcac 
aactttgaat 
catactatga 
tcgcttgatg 


aataaagatg 


ctaccttctg: 


acaaatttta 
gctgcagcct 
aatggtacaa 
tctgttaaga 
ccctcaggag 
tttaatgcta 
gttgctgatt 
gtttctgcca 
gtcaagggag 
aattataaat 
gatgctactt 
aggccctttg 
ccacctgctc 
attggctacc 
acggtttgtg 
tttaatggac 
caacaatttg 
gaaatattag 


aatgcttcat 


6U 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 


20 


25 


30 


35 


40 


45 


50 


55 
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ctgaagttgc tgttctatat caagatgtta actgcactga tgtttctaca gcaatccatg 


cagatcaact cacaccagct tggcgcatat attctactgg aaacaatgta ttccagactc 


aagcaggctg tcttatagga gctgagcatg tcgacacttc ttatgagtgc gacattccta 


ttggagctg 


<210>6 
<211> 2027 
<212> DNA 


<213> CORONAVIRUS 


<400> 6 


catgcagatc 
actcaagcag 
cctattggag 
Caaaaatcta 
aataacacca 
gtttctatgg 
tgtgctaatt 
ggtattgctg 
tacaaaaccc 
cctctaaagc 
gctgatgctg 
ctcatttgtg 
atgattgctg 
ggtgctggcg 
attggagtta 
aaggcgatta 
caagacgttg 
aattttggtg 
gcggaggtac 
acacaacaac 
atgtctgagt 
cttatgtcct 
ccatcccagg 


ttccctcgtg 


aactcacacc 
gctgtcttat 
ctggcatttg 
ttgtggctta 
ttgctatacc 
ctaaaacctc 
tgcttctcca 
ctgaacagga 
caactttgaa 
caactaagag 
gcttcatgaa 
cgcagaagtt 
cctacactgc 
ctgctcttca 
cccaaaatgt 
gtcaaattca 
ttaaccagaa 
caatttcaag 
aaattgacag 
taatcagggc 
gtgttcttgg 
tcccacaagc 
agaggaactt 


aaggtgtttt 


agcttggcgc 
aggagctgag 
tgctagttac 
tactatgtct 
tactaacttt 
cgtagattgt 
atatggtagc 
tcgcaacaca 
atattttggt 
gtcttttatt 
gcaatatggc 
caatgggctt 
tgctctagtt 
aatacctttt 
tctctatgag 
agaatcactt 
tgctcaagca 
tgtgctaaat 
gttaattaca 
tgctgaaatc 
acaatcaaaa 
agccccgcat 
caccacagcg 


tgtgtttaat 


atatattcta 
catgtcgaca 
catacagttt - 
ttaggtgctg 
tcaattagca 
aatatgtaca 
ttttgcacac 
cgtgaagtgt 
ggttttaatt 
gaggacttgc 
gaatgcctag 
acagtgttgc 
agtggtactg 
gctatgcaaa 
aacCCaaaaac 
acaacaacat 
ttaaacacac 
gatatccttt 
ggcagacttc 
agggcttctg 
agagttgact 
ggtgttgtct 
ccagcaattt 


ggcacttctt 


96 


ctggaaacaa 
cttcttatga 
ctttattacg 
atagttcaat 
ttactacaga 
tctgcggaga 
aactaaatcg 
tcgctcaagt 
tttcacaaat 
tctttaataa 
gtgatattaa 
cacctctgct 
ccactgctgg 
tggcatatag 
aaatcgccaa 
caactgcatt 
ttgttaaaca 
cgcgacttga 
aaagccttca 
ctaatcttgc 
tttgtggaaa 
tcctacatgt 
gtcatgaagg 
ggtttattac 


tgtattccag 
gtgcgacatt 
tagtactagc 
tgcttactct 
agtaatgcct 
ttctactgaa 
tgcactctca 
Caaacaaatg 
attacctgac 
ggtgacactc 
tgctagagat 
cactgatgat 
atggacattt 
gttcaatggc 
ccaatttaac 
gggcaagctg 
acttagctct 
taaagtcgag 
aacctatgta 
tgctactaaa 
gggctaccac 
cacgtatgtg 
caaagcatac 


acagaggaac 


1920 
1980 
2040 
2049 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 


20 


25 


30 


35 


40 


45 


50 


55 


ttcttttctc 
gttattggcg 
aaagaagagc 
atttcaggca 
gtcgctaaaa 
tatattaaat 
atggttacaa 
tcttgtggtt 
aaattacatt 


caattactgc 


<210>7 
<211> 1096 
<212> DNA 
<213> CORO 


<400> 7 


tettgctttg 
cttgctgcaa 
acacataaac 
acagccagta 
accgctacaa 
ttttcagage 
gggcttccag 
gcttgtcgct 
acaatgcatc 
Caagaaccca 
ctactgtata 
ttcaacacca 
aggtgttaaa 
gtctacacaa 
gcttgttaaa 
taatccagca 
agcacaagaa 


aatagttaat 


cacaaataat 
tcattaacaa 
tggacaagta 
ttaacgcttc 
atttaaatga 
ggccttggta 
tcttgctttg 
cttgctgcaa 
acacataaac 


acagccagta 


NAVIRUS 


ttgcatgact 
gtttgatgag 
gaacttatgg 
aaaattgaca 
gcctcactcc 
gctaccaaaa 
ttcatttgca 
gcaggtatgg 
aacgcatgta 
ttactttatg 
ccatataaca 
aaactcaaag 
gactatgtcg 
attactacag 
gacccaccga 
atggatccaa 
agtgagtacg 


agcgtacttc 
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tactacagac 
cacagtttat 
cttcaaaaat 
tgtcgtcaac 
atcactcatt 
tgtttggctc 
ttgcatgact 
gtttgatgag 
gaacttatgg 


aaaattgaca 


agttgttgca 
gatgactctg 
atttgtttat 
atgcttctcc 
ctttcggatg 
taattgcgct 
atttactgct 
aggcgcaatt 
gaattattat 
atgccaacta 
gtgtcacaga 
aagactacca 
ttgtacatgg 
acactggtat 
atgtgcaaat 
tttatgatga 
aacttatgta 
tttttcttge 


aatacatttg 
gatcctctgc 
catacatcac 
attcaaaaag 
gaccttcaag 
ggcttcattg 
agttgttgca 
gatgactctg 
atttgtttat 


atgcttctcc 


gttgcctcaa 
agccagttct 
gagatttttt 
tgcaagtact 
gcttgttatt 
caataaaaga 
gctatttgtt 
tttgtacctc 
gagatgttgg 
ctttgtttgc 
tacaattgtc 
aattggtggt 
ctatttcacc 
tgaaaatgct 
acacacaatc 
gccgacgacg 
ctcattcgtt 
tttcgtggta 


97 


tctcaggaaa 
aacctgagct 
cagatgttga 
aaattgaccg 
aattgggaaa 
ctggactaat 
gttgcctcaa 
agccagttct 
gagatttttt 
tgcaagt 


gggtgcatge 
caagggtgtc 
actcttggat 
gttcatgcta 
ggcgttgcat 
tggcagctag 
accatctatt 
tatgccttga 
ctttgttgga 
tggcacacac 
gttactgaag 
tattctgagg 
gaagtttact 
acattcttca 
gacggctctt 
actactagcg 
tcggaagaaa 


ttcttgctag 


ttgtgatgtc 
tgactcattc 
tcttggcgac 
cctcaatgag 
atatgagcaa 
tgccatcgtc 
gggtgcatge 
caagggtgtc 
actcttggat 


tcttgtggtt 
aaattacatt 
caattactgc 
cagcaacgat 
ttcttgctgt 
ccctttataa 
cacatctttt 
tatattttct 
agtgcaaatc 
ataactatga 
gtgacggcat 
ataggcactc 
accagcttga 
tctttaacaa 
caggagttgc 
tgcctttgta 
caggtacgtt 


tcacactagc 


1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2027 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 


20 


25 


30 


35 


40 


45 


50 


55 


catccttact gcgctt 


<210> 8 
<211> 1135 
<212> DNA 


<213> CORONAVIRUS 


<400> 8 


attgccatcg 
aagggtgcat 
ctcaagggtg 
ttactcttgg 
ctgttcatgc 
ttggcgttgc 
gatggcagct 
ttaccatcta 
tctatgcctt 
ggctttgttg 
gctggcacac 
tcgttactga 
gttattctga 
ccgaagttta 
ctacattctt 
tcgacggctc 
cgactactag 
tttcggaaga 
tattcttgct 


<210>9 
<211> 1096 
<212> DNA 


tcatggttac 
gctcttgtgg 
tcaaattaca 
atcaattact 
tacagcaacg 
atttcttgct 
agccctttat 
ttcacatctt 
gatatatttt 
gaagtgcaaa 
acataactat 
aggtgacggc 
ggataggcac 
ctaccagctt 
catctttaac 
ttcaggagtt 
cgtgcctttg 
aacaggtacg 


agtcacacta 


<213> CORONAVIRUS 


<220> 
<221> CDS 


<222> (137)..(958) 


<223> 


<400> 9 
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aatcttgctt 
ttcttgctgc 
ttacacataa 
gcacagccag 
ataccgctac 
gtttttcaga 
aagggcttcc 
ttgcttgtcg 
ctacaatgca 
tccaagaacc 
gactactgta 
atttcaacac 
tcaggtgtta 
gagtctacac 
aagcttgtta 
gctaatccag 
taagcacaag 
ttaatagtta 


gccatcctta 


tgttgcatga 
aagtttgatg 
acgaacttat 
taaaaattga 
aagcctcact 
gcgctaccaa 
agttcatttg 
ctgcaggtat 
tcaacgcatg 
cattacttta 
taccatataa 
caaaactcaa 
aagactatgt 
aaattactac 
aagacccacc 
caatggatcc 
aaagtgagta 
atagcgtact 
ctgcgcttcg 


98 


ctagttgttg 
aggatgactc 
ggatttgttt 
caatgcttct 
ccctttcgga 
aataattgcg 
caatttactg 
ggaggcgcaa 
tagaattatt 
tgatgccaac 
cagtgtcaca 
agaagactac 
cgttgtacat 
agacactggt 
gaatgtgcaa 
aatttatgat 
cgaacttatg 
tctttttctt 
attgtgtgcg 


cagttgcctc 
tgagccagtt 
atgagatttt 
cctgcaagta 
tggcttgtta 
ctcaataaaa 
ctgctatttg 
tttttgtacc 
atgagatgtt 
tactttgttt 
gatacaattg 
caaattggtg 
ggctatttca 
attgaaaatg 
atacacacaa 
gagccgacga 
tactcattcg 
gctttcgtgg 
tactg 


1096 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 
1135 


20 


25 


30 


35 


40 


45 


50 


55 
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tcttgctttg ttgcatgact agttgttgca gttgcctcaa gggtgcatge tcttgtggtt 


cttgctgcaa gtttgatgag gatgactctg agccagttct caagggtgtc aaattacatt 


acacataaac gaactt atg gat ttg ttt atg aga ttt ttt act ctt gga tca 
as Asp Leu Phe Arg Phe Phe Thr Leu G 
10 


att 
Ile 


gtt 
Val 


tgg 
Trp 
45 


aaa 
Lys 


ttc 
Phe 


cat 
His 


tat 
Tyr 


atg 
Met 
125 
tat 
Tyr 


tgt 
cys 


gac 
ASp 


tat 
Tyr 


ely 
205 


aca 


act 
Thr 


cat 
His 
30 


ctt 
Leu 


ata 
Tle 


cag 
GIn 


ctt 
Leu 


gcc 
Ala 
110 


aga 
Arg 


gat 
ASp 


ata 
Tle 


ggc 
Gly 


tct 
ser 
190 


tat 
Tyr 


gac 


gca 
Ala 
15 


gct 
Ala 


gtt 
val 


att 
Ile 


ttc 
Phe 


ttg 
Leu 
95 


ttg 
Leu 


tgt 
cys 


gcc 
Ala 


cca 
Pro 


att 
Ile 
175 


gag 
Glu 


ttc 
Phe 


act 


cag 
Gin 


aca 
Thr 


att 
Ile 


gcg 
Ala 


att 
Ile 
80 


ctt 
Leu 


ata 
Ile 


tgg 
Trp 


aac 
Asn 


tat 
Tyr 
160 


tca 
ser 


gat 
Asp 


acc 
Thr 


ggt 


cca 
Pro 


gca 
Ala 


éty 


ctc 
Leu 
65 


tgc 
cys 


gtc 
Val 


tat 
Tyr 


ctt 
Leu 


tac 
Tyr 
145 


aac 
Asn 


aca 
Thr 


agg 
Arg 


gaa 
Glu 


att 


gta 
val 


acg 
Thr 


gtt 
Val 
50 

aat 
Asn 


aat 
Asn 


gct 
Ala 


ttt 
Phe 


tgt 
cys 
130 
ttt 
Phe 


agt 
Ser 


cca 
Pro 


cac 
His 
gtt 
210 


gaa 


aaa 
Lys 


ata 
Ile 
35 


gca 
Ala 


aaa 
Lys 


tta 
Leu 


gca 
Ala 


cta 
Leu 
115 


tgg 
Trp 


gtt 
val 


gtc 
Val 


ada 
Lys 


tca 
ser 
195 


tac 
Tyr 


aat 


att 
Tle 
20 

ccg 
Pro 


ttt 
Phe 


aga 
Arg 


ctg 
Leu 


ety 
100 


caa 
Gln 


aag 
Lys 


tgc 
cys 


aca 
Thr 


ctc 
Leu 
180 


ety 


tac 
Tyr 


gct 


gac 
Asp 


cta 
Leu 


ctt 
Leu 


tgg 
Trp 


ctg 
Leu 
85 


atg 
Met 


tgc 
cys 


tgc 
cys 


tgg 
Trp 


gat 
Asp 
165 


aaa 
Lys 


gtt 
val 


cag 
Gln 


aca 


aat 
Asn 


caa 
Gln 


gct 
Ala 


cag 
Glin 
70 


cta 
Leu 


gag 
Glu 


atc 
Ile 


aaa 
Lys 


cac 
His 
150 
aca 
Thr 


gaa 
Glu 


aaa 
Lys 


ctt 
Leu 


ttc 


99 


gct 
Ala 


gcc 
Ala 


gtt 
Val 
55 


cta 
Leu 


ttt 
Phe 


gcg 
Ala 


aac 
Asn 


tcc 
ser 
135 


aca 
Thr 


att 
Ile 


gac 
Asp 


gac 
Asp 


gag 
Glu 
215 


ttc 


tect 
ser 


tca 
ser 
40 


ttt 
Phe 


gcc 
Ala 


gtt 
Val 


caa 
GIn 


gca 
Ala 
120 


aag 
Lys 


cat 
His 


gtc 
Val 


tac 
Tyr 


tat 
Tyr 
200 


tct 
ser 


atc 


cct 
Pro 
25 


ctc 
Leu 


cag 
Gln 


ctt 
Leu 


acc 
Thr 


ttt 
Phe 
105 


tgt 
cys 


aac 
Asn 


aac 
Asn 


gtt 
val 


caa 
Glin 
185 


gtc 
val 


aca 
Thr 


ttt 


gca 
Ala 


cct 
Pro 


agc 
ser 


tat 
Tyr 


atc 
Ile 
90 


ttg 
Leu 


aga 
Arg 


cca 
Pro 


tat 
Tyr 


act 
Thr 
170 


att 
Ile 


gtt 
Val 


caa 
GtIn 


aac 


agt 
ser 


ttc 
Phe 


gct 
Ala 


aag 
Lys 
75 


tat 
Tyr 


tac 
Tyr 


att 
Ile 


tta 
Leu 


gac 
Asp 
155 


gaa 
Glu 


ety 


gta 
Val 


att 
Tle 


aag 


y ser 


act 
Thr 


ety 


acc 
Thr 
60 


ety 


tca 
ser 


ctc 
Leu 


att 
tle 


ctt 
Leu 
140 


tac 
Tyr 


ety 


ety 


cat 
His 


act 
Thr 
220 


ctt 


60 


120 


172 


220 


268 


316 


364 


412 


460 


508 


556 


604 


652 


700 


748 


796 


844 


20 


25 


30 


35 


40 


45 


50 


55 


Thr Asp Thr Gly Ile 
225 


gtt aaa gac cca ccg 
Val Lys Asp Pro Pro 


240 


aga gtt gct aat cca 
Gly Val Ala Asn Pro 


255 


act act age gtg cct 
Thr Thr Ser Val Pro 


270 


Glu 


aat 
Asn 


gca 
Ala 


ttg 
Leu 


Asn 


gt 
Va 


atg 
Met 
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Ala 


Caa 
GIn 


gat 
Asp 
260 


Thr 


ata 
Tle 
245 


cca 
Pro 


Phe 
230 


cac 
H1s 


att 
Ile 


Phe 


aca 
Thr 


tat 
Tyr 


Ile 


Phe 


atc gac 
Ile Asp 


gat 


gag 


Asp Glu 


265 


Asn 
ggc 
ely 
250 


ccg 
Pro 


taagcacaag aaagtgagta cgaacttatg 


Lys 
235 


tct 
ser 


acg 


Leu 


tca 
ser 


acg 


Thr Thr 


tactcattcg tttcggaaga aacaggtacg ttaatagtta atagcgtact tctttttctt 


gctttcgtgg tattcttgct agtcacacta gccatcctta ctgcgctt 


<210> 10 

<211> 274 

<212> PRT 

<213> CORONAVIRUS 


<400> 10 


Met Asp Leu 


Pro Val Lys 


Ala Thr Ile 
35 


Gly val Ala 
50 


Leu Asn Lys 
65 


cys Asn Leu 
Val Ata Ala 
Tyr Phe Leu 

115 


Leu Cys Trp 


Phe 


Ile 


20 


Pro 


Phe 


Arg 


Leu 


Gly 


Gln 


Lys 


Met 


Asp 


Leu 


Leu 


Trp 


Leu 


85 


Met 


cys 


cys 


Arg 


Asn 


Glin 


Ala 


Glin 


70 


Leu 


Glu 


Tle 


Lys 


Phe 


Ala 


Ala 


val 


55 


Leu 


Phe 


Ala 


Asn 


Ser 
135 


Phe 


ser 


ser 


40 


Phe 


Ala 


val 


Gin 


Ala 


120 


Lys 


1 


Thr 


Pro 


25 


Leu 


Glin 


Leu 


Thr 


Phe 


105 


cys 


Asn 


00 


Leu 


10 


Ala 


Pro 


ser 


Tyr 


Ile 


90 


Leu 


Arg 


Pro 


Gly 


ser 


Phe 


Ala 


Lys 


Tyr 


Tyr 


Ile 


Leu 


ser 


Thr 


Gly 


Thr 


60 


Gly 


ser 


Leu 


Ile 


Leu 
140 


Ite 


Val 


Trp 


45 


Lys 


Phe 


His 


Tyr 


Met 


125 


Tyr 


Thr 


His 


30 


Leu 


Ile 


Gin 


Leu 


Ala 


110 


Arg 


Asp 


Ala 


15 


Ala 


val 


Ile 


Phe 


Leu 


95 


Leu 


cys 


Ala 


Glin 


Thr 


Tle 


Ala 


Tle 


80 


Leu 


Tle 


Trp 


Asn 


892 


940 


988 


1048 
1096 
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30 


35 


40 


45 


50 


55 


Tyr Phe val 


145 


Asn ser Val 


Thr Pro Lys 


ser 
195 


Arg His 


val 
210 


Glu Tyr 


Ile Glu Asn 


225 


Pro Asn Val 


Pro 


Ala 


Met 


Pro Leu 


<210> 11 
<211> 1096 
<212> DNA 


cys Trp 


Thr Asp 


Leu 
180 


Lys 
Gly val 
Tyr Gin 


Ala Thr 


His 


150 


Thr 


Glu 


Lys 


Leu 


Phe 
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Thr 


Ile val 


Asp Tyr 


Asp Tyr 


200 


Glu 
215 


ser 


Phe Ile 


230 


Ile 
245 


Gln 


Asp Pro 


260 


<213> CORONAVIRUS 


<220> 
<221> CDS 
<222> (558)..(1 
<223> 


<400> 11 


tcttgctttg 
cttgctgcaa 
acacataaac 
acagccagta 
accgctacaa 


ttttcagagce 


019) 


ttgcatgact 
gtttgatgag 
gaacttatgg 
aaaattgaca 
gcctcactcc 


gctaccaaaa 


His 


Thr Ile 


val 


GIn 


185 


val 


Thr 


Phe 


Asp 


Thr Glu 


170 


Ile Gly 


val val 
Gln Ile 
Asn Lys 
Ser 


Gly 
2 


Thr 


His Asn Tyr Asp Tyr 
155 


Gly 


Gly 


His 


Thr 


220 


Leu 


ser 


Thr 


cys 


Asp 


Tyr 


Gly 


Thr 


val 


Gly 


Thr 


Ile 


Gly 


ser 
190 


‘Tyr 


Asp 


Lys 


val 


Thr 


Ile 


Tyr 


Asp 


Glu 


Pro 


Pro Tyr 


160 


Ile 
175 


ser 
Glu Asp 
Phe Thr 
Thr Gly 


Pro 
240 


Asp 
Asn 


Ala 


Ser Val 


agttgttgca 
gatgactctg 
atttgtttat 
atgcttctcc 
ctttcggatg 
taattgcgct 


265 


gttgcctcaa 
agccagttct 
gagatttttt 
tgcaagtact 
gcttgttatt 


Caataaaaga 


101 


270 


gggtgcatge 
caagggtgtc 
actcttggat 
gttcatgcta 
ggcgttgcat 
tggcagctag 


tcttgtggtt 
aaattacatt 
caattactgc 
cagcaacgat 
ttcttgctgt 


ccctttataa 


60 
120 
180 
240 
300 
360 
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gggcttccag ttcatttgca atttactgct gctatttgtt accatctatt cacatctttt 420 

gcttgtcgct gcaggtatgg aggcgcaatt tttgtacctc tatgccttga tatattttct 480 

acaatgcatc aacgcatgta gaattattat gagatgttgg ctttgttgga agtgcaaatc 540 

Ccaagaaccca ttacttt atg atg cca act act ttg ttt gct ggc aca cac 590 
— Met Pro Thr ee Leu Phe Ala Gly ane His 


ata act atg act act gta tac cat ata aca gtg tca cag ata caa ttg 638 


20 


25 


30 


35 


40 


45 


50 


55 


Ile Thr Met Thr Thr Val Tyr His af Thr va 


tcg 
ser 


acc 
Thr 


atg 
Met 
60 


cta 
Leu 


tct 
ser 


tcg 
ser 


atg 
Met 


agt 
Ser 
140 


tta 
Leu 


aaa 
Lys 
45 


tcg 
ser 


cac 
His 


tta 
Leu 


acg 
Thr 


agc 
ser 
125 


acg 
Thr 


ctg 
Leu 
30 


ttg 
Leu 


ttg 
Leu 


aaa 
Lys 


aca 
Thr 


gct 
Ala 
110 


cga 
Arg 


aac 
Asn 


15 


aag 
Lys 


gtg 
val 


tac 
Tyr 


tta 
Leu 


agc 
ser 
95 


ctt 
Leu 


cga 
Arg 


tta 
Leu 


gt 
Va 


gtt 
Val 


atg 
Met 


cta 
Leu 
80 


ttg 
Leu 


cag 
GIn 


cga 
Arg 


tgt 
cys 


acg 
Thr 


att 
Ile 


gct 
Ala 
65 


cag 
Gln 


tta 
Leu 


gag 
Glu 


cta 
Leu 


act 
Thr 
145 


gca 
Ala 


ctg 
Leu 
50 


att 
Tle 


aca 
Thr 


aag 
Lys 


ttg 
Leu 


cta 
Leu 
130 
cat 
His 


ttt 
Phe 
35 


agg 
Arg 


tca 
ser 


ctg 
Leu 


acc 
Thr 


cta 
Leu 
115 


gcg 
Ala 


tcg 
ser 


caa 
GIn 


ata 
Ile 


ccg 
Pro 


gta 
val 


cac 
His 
100 
atc 
Ile 


tgc 
cys 


ttt 
Phe 


cac 
His 


ggc 
Gly 


aag 
Lys 


ttg 
Leu 
85 


cga 
Arg 


cag 
Gln 


ctt 
Leu 


cgg 
Arg 


caa 
Gin 


act 
Thr 


ttt 
Phe 
70 


aaa 
Lys 


atg 
Met 


caa 
Gin 


tgt 
cys 


aag 
Lys 
150 


taatagttaa tagcgtactt ctttttcttg ctttcgtggt 


ccatccttac tgcgctt 


<210> 12 


<211> 154 
<212> PRT 
<213> CORONAVIRUS 


<400> 12 


Ser Gin Ile Gin Leu 
25 


aac 
Asn 


cag 
Glin 
55 


act 
Thr 


atg 
Met 


tgc 
cys 


tgg 
Trp 


aag 
Lys 
135 


aaa 
Lys 


attcttgcta gtcacactag 


tca 
ser 
40 


gt 
Va 


acc 
Thr 


cta 
Leu 


ada 
Lys 


atc 
Ile 
120 


cac 
H1s 


cag 
Gin 


aag 
Lys 


tta 
Leu 


agc 
ser 


cat 
His 


tac 
Tyr 
105 


caa 
GlIn 


aag 
Lys 


gta 
Val 


aag 
Lys 


aag 
Lys 


ttg 
Leu 


tct 
ser 
90 


aca 
Thr 


ttt 
Phe 


aaa 
Lys 


cgt 
Arg 


act 
Thr 


act 
Thr 


agt 
Ser 
75 


tca 
ser 


caa 
GIn 


atg 
Met 


gt 
Va 


686 


734 


782 


830 


878 


926 


974 


1019 


1079 
1096 


Hee Met Pro Thr mat Leu Phe Ala Gly in His Ile Thr Met an Thr 


102 


20 


25 


30 


35 


40 


45 


50 


55 


val 


Thr 


Ile 


Ala 


65 


Gln 


Leu 


Glu 


Leu 


Thr 
145 


Tyr 


Ala 


Leu 


50 


Tle 


Thr 


Lys 


Leu 


Leu 


130 


His 


<210> 13 


<211> 332 


His 


Phe 


35 


Arg 


ser 


Leu 


Thr 


Leu 


115 


Ala 


ser 


<212> DNA 
<213> CORONAVIRUS 


<220> 
<221> CDS 
<222> (36)..(263) 
<223> 


<400> 13 


Ile 
20 


Gin 


Ile. 


Pro 


Val 


His 


100 


Ile 


cys 


Phe 


Thr 


His 


Gly 


Lys 


Leu 


85 


Arg 


Gin 


Leu 


Arg 


val 


Gin 


Thr 


Phe 


70 


Lys 


Met 


GIn 


cys 


Lys 


ser 


Asn 


GIn 


Thr 


Met 


cys 


Trp 


Lys 


Lys 
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Gin Ile Gln Leu 
25 


Ser Lys 


40 


Val Leu 


Thr Ser 


Leu His 


Lys Tyr 
105 


Ile Gin. 


120 


His Lys 


Gin Val 


Lys 


Lys 


Leu 


ser 


90 


Thr 


Phe 


Lys 


Arg 


Thr 


Thr 


ser 


75 


ser 


Gln 


Met 


val 


ser 


Thr 


Met 


60 


Leu 


ser 


ser 


Met 


ser 
140 


Leu 


His 


Leu 


Thr 


ser 


125 


Thr 


Leu 


30 


Leu 


Leu 


Lys 


Thr 


Ala 


110 


Arg 


Asn 


Lys 


Val 


Tyr 


Leu 


ser 


95 


Leu 


Arg 


Leu 


val 


val 


Met 


Leu 


80 


Leu 


Gln 


Arg 


cys 


tgcctttgta agcacaagaa agtgagtacg aactt atg tac tca ttc gtt tcg 


gaa gaa aca 
Glu Glu Thr 


ttc 
Phe 


gt 
Va 


gta ttc ttg cta gtc aca cta gcc atc ctt act gcg ctt cga 
Val Phe Leu Leu Val Thr Leu Ala Ile Leu ae Ala Leu Arg 


25 


Met Tyr Ser Phe ual ser 
1 


t acg tta ata gtt aat agc gta ctt ctt ttt ctt gct 


g 
aly Thr Leu Ile Val Asn Ser Val Leu Leu Phe Leu Ala 
10 a5 20 


30 


103 


53 


101 


149 
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25 


30 


35 


40 


45 


50 


55 
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ttg tgt gcg tac tgc tgc aat att gtt aac gtg agt tta gta aaa cca 
Leu . Ala Tyr Cys Cys Asn Ile Val Asn Val Ser Leu Val Lys Pro 
4 45 50 


acg gtt tac gtc tac tcg cgt gtt aaa aat ctg aac tct tct gaa gga 
Thr Val Tyr Val Tyr a Arg Val Lys Asn Leu Asn Ser Ser Glu Gly 
55 65 70 


gtt cct gat ctt ctg gtc taaacgaact aactattatt attattctgt 
Val Pro Asp Leu Leu Val 


75 
ttggaacttt aacattgctt atcatggcag acaacggta 
<210> 14 
<211> 76 
<212> PRT 


<213> CORONAVIRUS 


<400> 14 
uct Tyr Ser Phe vl Ser Glu Glu Thr oy Thr Leu Ile val Asn Ser 
Val Leu Leu Phe Leu Ala Phe Val Val Phe Leu Leu Val Thr Leu Ala 
20 25 30 


Ile Leu a Ala Leu Arg Leu . Ala Tyr Cys Cys ae Ile val Asn 


val any Leu Val Lys Pro ey val Tyr val Tyr ace Arg Val Lys Asn 


Leu Asn Ser Ser Glu Gly Val Pro Asp Leu Leu val 
65 70 75 


<210> 15 

<211> 332 

<212> DNA 

<213> CORONAVIRUS 


<400> 15 


tgcctttgta agcacaagaa agtgagtacg aacttatgta ctcattcgtt tcggaagaaa 
caggtacgtt aatagttaat agcgtacttc tttttcttgc tttcgtggta ttcttgctag 
tcacactagc catccttact gcgcttcgat tgtgtgcgta ctgctgcaat attgttaacg 
tgagtttagt aaaaccaacg gtttacgtct actcgcgtgt taaaaatctg aactcttctg 
aaggagttcc tgatcttctg gtctaaacga actaactatt attattattc tgtttggaac 


tttaacattg cttatcatgg cagacaacgg ta 


104 


197 


245 


293 


332 


60 
120 
180 
240 
300 


332 
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25 


30 


35 


40 


45 


50 


55 
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<210> 16 

<211> 708 

<212> DNA 

<213> CORONAVIRUS 


<220> 

<221> CDS 
<222> (41)..(703) 
<223> 


<400> 16 


tattattatt attctgtttg gaactttaac attgcttatc atg 
Met 
i 


act att acc gtt gag gag ctt aaa caa ctc ctg gaa 
Thr Ile Thr val oa Glu Leu Lys Gln ie Leu Glu 
1 


gta ata ggt ttc cta ttc cta gcc tgg att atg tta 
val Ile Gly ae Leu Phe Leu Ala ue Ile Met Leu 


tat tct aat cgg aac agg ttt ttg tac ata ata aag 
Tyr Ser Asn Arg Asn Arg Phe Gee Tyr Ile Ile Lys 
40 


tgg ctc ttg tgg cca gta aca ctt gct tgt ttt gt 
Trp Leu Leu Trp Pro Val ae Leu Ala Cys Phe 
55 


tac aga att aat tgg gtg act ggc gq att gcg att 
ane Arg Ile Asn Trp ye thr Gly Gly Ile Ne Ile 


att gta gac ttg atg tgg ctt agc tac ttc gtt gct 
Ile val Gly Leu a Trp Leu Ser Tyr oer val Ala 


ttt gct cgt acc cgc tca atg tgg tca ttc aac cca 
Phe Ala Arg ant Arg Ser Met Trp see Phe Asn Pro 
1 


ctt ctc aat gtg cct ctc cgg 999 aca att gtg acc 
Leu Leu Asn Val Pro Leu Arg oe Thr rle Val Thr 
120 5 


gaa agt gaa ctt gtc att ggt gct gtg atc att cgt 
Glu ser Glu Leu Val Ile Gly Ala Val Ile Ile Arg 
135 140 145 


atg gcc gga cac tcc cta 999 cgc tgt gac att aag 
Gly Gly 


Met Ala His Ser Leu Arg Cys Asp Ile Lys 
150 155 160 


105 


gca 
Ala 


caa 
Gln 


cta 
Leu 


ctt 
Leu 
50 


ctt 
Leu 


gca 
Ala 


tcc 
ser 


gaa 
Glu 


aga 
Arg 
130 


ety 


gac 
Asp 


gac 
ASp 


tgg 
Trp 


caa 
Gin 
35 


gtt 
Val 


gct 
Ala 


atg 
Met 


ttc 
Phe 


aca 
Thr 
115 


ccg 
Pro 


cac 
H1S 


ctg 
Leu 


aac 
Asn 


aac 
Asn 
20 


ttt 
Phe 


ttc 
Phe 


gct 
Ala 


gct 
Ala 


agg 
100 


aac 
Asn 


ctc 
Leu 


ttg 
Leu 


cca 
Pro 


a 
5 


cta 
Leu 


gcc 
Ala 


ctc 
Leu 


gtc 
Val 


tgt 
cys 
85 


ctg 
Leu 


att 
Ile 


atg 
Met 


cga 
Arg 


aaa 
Lys 
165 


39 


103 


151 


199 


247 


295 


343 


391 


439 


487 


535 


20 


25 


30 


35 


40 


45 


50 


55 


gag atc 
Glu Ile 


gcg tcg 
Ala ser 


tac cgt 
Tyr Arg 


gac aat 
Asp Asn 
215 


<210> 17 


<211> 221 


act 


g 
Thr v 


af 


cag cgt 
Gln Arg 


gct aca 
Ala Thr 


170 


185 


200 


att gct 
Ile Ala 


<212> PRT 
<213> CORONAVIRUS 


<400> 17 


Met Ala 


Glu Glin 


Leu Leu 


Lys Leu 


50 


Val Leu 


65 


Ile Ala 


Ala Ser 


Pro Glu 


Thr Arg 


Arg Gly 
145 


att ely 


Asp 


Trp 


GIn 


35 


Val 


Ala 


Met 


Phe 


Thr 


115 


Pro 


His 


gta ggc 
Val Gly 


aac tat 
Asn Tyr 


ttg cta 
Leu Leu 


tca cga acg ctt tct tat tac 
ser Arg Thr Leu Ser Tyr Tyr 


act gat tca ggt ttt gct gca 
Thr Asp Ser Gly Phe Ala Ala 


aaa tta aat aca gac cac gcc 
Lys Leu Asn Thr Asp His 
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175 


190 


205 


gta cag taagt 
Val Gln 


220 


Asn ey Thr 


Asn Leu Val 


20 


Phe Ala Tyr 


Phe Leu Trp 


Ala Val Tyr 


70 


Ala Cys Ile 


Arg Leu Phe 


Asn Ile Leu 


Leu Met Glu 


Leu Arg Met 


150 


Ile Thr Val Glu 
10 


Ile Gly Phe Leu 
25 


Ser Asn Arg Asn 
40 


Leu Leu Trp Pro 
55 


Arg Ile Asn Trp 


Val Gly Leu Met 
90 


Ala Arg Thr Arg 
105 


Leu Asn Val Pro 
120 


Ser Glu Leu Val 
135 


Ala Gly His Ser 


106 


Ala 


aaa 
Lys 


tac 
Tyr 


tta 
Leu 


180 


195 


210 


Glu 


Phe 


Arg 


Val 


Val 


75 


Trp 


ser 


Leu 


Ile 


Leu 
155 


Leu 


Leu 


Phe 


Thr 


60 


Thr 


Leu 


Met 


Arg 


Gly 


Gly 


aty 


Lys 


Ala 


Leu 


45 


Leu 


Gly 


ser 


Trp 


Gly 


Ala 


Arg 


aac 
Asn 


agc 
Ser 


Gin 


Trp 


30 


Tyr 


Ala 


Gly 


Tyr 


ser 


110 


Thr 


val 


cys 


ty 


cgc 
Arg 


aac 
Asn 


Leu 


15 


Ile 


Ile 


cys 


Ile 


Phe 


95 


Phe 


Ile 


Ile 


Asp 


Leu 


Met 


Ile 


Phe 


Ala 


80 


val 


Asn 


val 


Ile 


Ile 
160 


583 


631 


679 


708 
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Lys Asp Leu Pro Lys Glu Ile Thr val ala Thr Ser Arg Thr ioe ser 
7 


165 1 


Tyr Tyr Lys Leu Gly Ala Ser Gln Arg Val Gly Thr Asp Ser Gly Phe 
180 185 190 


Ala Ala Tyr Asn Arg Tyr Arg Ile Gly Asn Tyr Lys Leu Asn Thr Asp 
195 200 205 


His Ala Gly Ser Asn Asp Asn Ile Ala Leu Leu Val Glin 
210 215 220 


20 


25 


30 


35 


40 


45 


50 


<210> 18 
<211> 769 
<212> DNA 


<213> CORONAVIRUS 


<400> 18 


cctgatcttc 
tgcttatcat 
aatggaacct 
attctaatcg 
cagtaacact 
ggattgcgat 
ecttcaggct 
ttctcaatgt 
tcattggtgc 
gtgacattaa 
acaaattagg 
accgtattgg 
tgctagtaca 


<210> 19 
<211> 1231 
<212> DNA 


tggtctaaac 
ggcagacaac 
agtaataggt 
gaacaggttt 
tgcttgtttt 
tgcaatggct 
gtttgctcgt 
gcctctccgg 
tgtgatcatt 
ggacctgcca 
agcgtcgcag 
aaactataaa 


gtaagtgaca 


<213> CORONAVIRUS 


<400> 19 


gaactaacta 
ggtactatta 
ttcctattcc 
ttgtacataa 
gtgcttgctg 
tgtattgtag 
acccgctcaa 
gggacaattg 
cgtggtcact 
aaagagatca 
cgtgtaggca 
ttaaatacag 


acagatgttt 


ttattattat 
ccgttgagga 
tagcctggat 
taaagcttgt 
ctgtctacag 
gcttgatgtg 
tgtggtcatt 
tgaccagacc 
tgcgaatggc 
ctgtggctac 
ctgattcagg 
accacgccgg 


catcttgttg 


tctgtttgga 
gcttaaacaa 
tatgttacta 
tttcctctgg 
aattaattgg 
gcttagctac 
caacccagaa 
gctcatggaa 
cggacactcc 
atcacgaacg 
ttttgctgca 
tagcaacgac 


acttccagg 


actttaacat 
ctcctggaac 
caatttgcct 
ctcttgtggc 
gtgactggcg 
ttcgttgctt 
acaaacattc 
agtgaacttg 
ctagggcgct 
ctttcttatt 
tacaaccgct 


aatattgctt 


taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 


107 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
769 


60 


20 


25 


30 


35 


40 


45 
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55 


zgctagtac 
agagatattg 
aataagttca 
agatgatgaa 
tectgacatt 
gtacgactgt 
ttcaccctct 
cttgtgctga 
ttttcatcag 
ctgctctagt 
cactttaatt 
gcttattata 
ctaaacgaac 
cactgtagta 
acaacactag 
cttttcatag 
aagatccagc 
ctgctgcatt 
aatggacccc 
tcaactgaca 
<210> 20 


<211> 1242 
<212> DNA 


agtaagtgac 
attatcatta 
atagtgagac 
gaacctatgg 
gattgtattt 
actactaaaa 
tgctgacaat 
cggtactcga 
acaagaggag 
atttttaata 
gacttctatt 
ttttggtttt 
atgaaacttc 
cagcgctgtg 
gggtaatact 
atggcacact 
tggtggtgcg 
tagagacgta 
aatcaaacca 


ataaccagaa 


<213> CORONAVIRUS 


<400> 20 


gcatacaacc 
gacaatattg 
ggttacaata 
tcttgacgtt 
ttattcggag 
aaattattct 
agtgtgttag 


gcaattcacc 


gctaccgtat 
ctttgctagt 
gcagagatat 
ataataagtt 
ttagatgatg 
cttcctgaca 
aggtacgact 


atttcaccct 
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aacagatgtt 
tgaggacttt 
aattatttaa 
agttagatta 
acatcttgcg 
gaaccttgcc 
aaatttgcac 
catacctatc 
gttcaacaag 
ctttgcttca 
tgtgcettttt 
cactcgaaat 
tcattgtttt 
catctaataa 
tatagcactg 
atggttcaaa 
cttatagcta 
cttgttgttt 
acgtagtgcc 
tggaggacgc 


tggaaactat 
acagtaagtg 
tgattatcat 
caatagtgag 
aagaacctat 
ttgattgtat 
gtactactaa 


cttgctgaca 


tcatcttgtt 
caggattgct 
gcctctaact 
tccataaaac 
agctatatca 
catcaggaac 
taacttgcac 
agctgcgtgc 
agctctactc 
ccattaagag 
agcctttctg 
ccaggatcta 
gacttgtatt 
acctcatgtg 
cttggctttg 
catgcacacc 
ggtgttggta 
taaataaacg 
ccccgcatta 


a 


aaattaaata 
acaacagatg 
tatgaggact 
acagttattt 
ggagttagat 
ttacatcttg 
aagaaccttg 


ataaatttgc 


108 


gacttccagg 
atttggaatc 
aagaagaatt 
gaacatgaaa 
ctatcaggag 
atacgagggc 
tagcacacac 
aagatcagtt 
gccacttttt 
aaagacagaa 
ctattccttg 
gaagaacctt 
tctctatgca 
cttgaagatc 
tgctctagga 
taatgttact 
ccttcatgaa 
aacaaattaa 


catttggtgg 


cagaccacgc 
tttcatcttg 
ttcaggattg 
aagcctctaa 
tatccataaa 
cgagctatat 
cccatcagga 


actaacttgc 


ttacaatagc 
ttgacgttat 
attcggagtt 
attattctct 
tgtgttagag 
aattcaccat 
tttgcttttg 
tcaccaaaac 
ctcattgttg 
tgaatgagct 
ttttaataat 
gtaccaaagt 
gttgcatatg 
cttgtaaggt 
aaggttttac 
atcaactgtc 
ggtcaccaaa 
aatgtctgat 


acccacagat 


cggtagcaac 
ttgacttcca 
ctatttggaa 
ctaagaagaa 
acgaacatga 
cactatcagg 
acatacgagg 


actagcacac 


120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1231 


60 
120 
180 
240 
300 
360 
420 
480 


20 


25 


30 


35 


40 


45 


50 


55 


actttgcttt 
tttcaccaaa 
ttctcattgt 
aatgaatgag 
tgttttaata 
ttgtaccaaa 
cagttgcata 
tccttgtaag 
gaaaggtttt 
ctatcaactg 
aaggtcacca 
aaaatgtctg 


ggacccacag 


<210> 21 
<211> 1231 
<212> DNA 


tgcttgtgct 
acttttcatc 
tgctgctcta 
ctcactttaa 
atgcttatta 
gtctaaacga 
tgcactgtag 
gtacaacact 
accttttcat 
tcaagatcca 
aactgctgca 
ataatggacc 


attcaactga 


<213> CORONAVIRUS 


<220> 
<221> CDS 


<222> (86)..(274) 


<223> 


<400> 21 


EP 1 694 829 B1 


gacggtactc 
agacaagagg 
gtatttttaa 
ttgacttcta 
tattttggtt 
acatgaaact 
tacagcgctg 
aggggtaata 
agatggcaca 
gctggtggtg 
tttagagacg 
ccaatcaaac 


caataaccag 


gacataccta 
aggttcaaca 
tactttgctt 
tttgtgcttt 
ttcactcgaa 
tctcattgtt 
tgcatctaat 
cttatagcac 
ctatggttca 
cgcttatagc 
tacttgttgt 
caacgtagtg 
aatggaggac 


taccgtattg gaaactataa attaaataca gaccacgccg 


ttgctagtac agtaagtgac aacag atg 


aca 
Thr 
10 


att 
Tle 


ata 
Tie A 


tgg 
Trp 


cect 
Pro 


aag 
Lys 


atg gag 


aat 
Asn 


cta 
Leu 


tta 


gca gag ata ttg att 
Ta Glu 


Ile 


Leu 


Met 


atc 


Ile Ile 


15 


ctt 
Leu 


gac 
Asp 
30 


act 
Thr 
45 


aag 
Lys 


gat tat 


gtt 
Val 


aag 
Lys 


cca 


ata 
Ile 


ata 
Ile 


aat 
Asn 


tat 
Tyr 


ttt cat 
Phe His 


ctt 
Leu 


att 


atg 
Ile 


Met 


agg 
Arg 
20 


ata 
Iie 


tca 
ser 
35 


agt 
ser 


tta 
Leu 


tcg 
Ser 
50 


gag 
Glu 


109 


tcagctgcgt 
agagctctac 
caccattaag 
ttagcctttc 
atccaggatc 
ttgacttgta 
aaacctcatg 
tgcttggctt 
aacatgcaca 
taggtgttgg 
tttaaataaa 


ccccccgcat 


gc 


gtagcaacga caatattgct 


gtt gac ttc 
Val Asp Phe 


5 
act ttc 
Thr Phe 


gt 
Va 


aga 
Arg 


gat gat 
Asp Asp 


agg 
Arg 


caa 
Gin 


gaa 
Glu 
55 


gcaagatcag 
tcgccacttt 
agaaagacag 
tgctattcct 
tagaagaacc 
tttctctatg 
tgcttgaaga 
tgtgctctag 
cctaatgtta 
taccttcatg 
cgaacgaatt 


tacatttggt 


cag 
Gin 


gtt 
Val 


att 
ile 


gct 
Ala 
25 


ttt 
Phe 


tta 
Leu 
40 


cct 
Pro 


gaa 
Glu 


taaaacgaac atgaaaatta ttctcttcct 


540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1242 


60 
112 


160 


208 


256 


304 


20 


25 


30 


35 


40 


45 


50 


55 


EP 1 694 829 B1 


Met Glu ao. Asp Tyr Pro 


gacattgatt 
gactgtacta 
ccctcttgct 
tgctgacggt 
catcagacaa 
tctagtattt 
ttaattgact 
attatatttt 
acgaacatga 
gtagtacagc 
cactaggggt 
tcatagatgg 
tccagctggt 
tgcatttaga 
gaccccaatc 


ctgacaataa 
<210> 22 


<211> 63 
<212> PRT 


gtatttacat 
ctaaaagaac 
gacaataaat 
actcgacata 
gaggaggttc 
ttaatacttt 
tctatttgtg 
ggttttcact 
aacttctcat 
gctgtgcatc 
aatacttata 
cacactatgg 
ggtgcgctta 
gacgtacttg 
aaaccaacgt 


ccagaatgga 


<213> CORONAVIRUS 


<400> 22 


ce Phe His Leu 


Ile Ile Met Arg 
20 


Ile Ser Ser Ile 
35 


Tyr Ser Glu Leu 
50 


<210> 23 
<211> 1231 
<212> DNA 


<213> CORONAVIRUS 


cttgcgagct 
cttgcccatc 
ttgcactaac 
cctatcagct 
aacaagagct 
gcttcaccat 
ctttttagcc 
Ccgaaatccag 
tgttttgact 
taataaacct 
gcactgcttg 
ttcaaacatg 
tagctaggtg 
ttgttttaaa 
agtgcccccc 


ggacgca 


atatcactat 
aggaacatac 
ttgcactage 
gcgtgcaaga 
ctactcgcca 
taagagaaag 
tttctgctat 
gatctagaag 
tgtatttctc 
catgtgcttg 
gctttgtgct 
cacacctaat 
ttggtacctt 
taaacgaaca 


gcattacatt 


caggagtgtg 
gagggcaatt 
acacactttg 
tcagtttcac 
ctttttctca 
acagaatgaa 
tecttgtttt 
aaccttgtac 
tatgcagttg 
aagatccttg 
ctaggaaagg 
gttactatca 
catgaaggtc 
aattaaaatg 


tggtggaccc 


ttagaggtac 
caccatttca 
cttttgcttg 
Caaaactttt 
ttgttgctge 
tgagctcact 
aataatgctt 
caaagtctaa 
catatgcact 
taaggtacaa 
ttttaccttt 
actgtcaaga 
accaaactgc 
tctgataatg 


acagattcaa 


364 
424 
484 
544 
604 
664 
724 
784 
844 
904 
964 
1024 
1084 
1144 
1204 
1231 


val Asp Phe Gln Val Thr Ile Ala Glu Ile Leu Ile 
5 10 15 


Thr Phe Arg Ile Ais Ile Trp Asn Leu aap val 


val Arg Gln 


Asp Asp Glu 
55 


Leu Phe Lys Pro Leu Thr Lys Lys 
40 45 


Glu Pro Met Glu Leu Asp Tyr Pro 
60 


110 


Ile 


Asn 


20 


25 


30 


35 


40 


45 


50 


55 


EP 1 694 829 B1 


<220> 
<221> CDS 

<222> (285)..(650) 
<223> 


<400> 23 


taccgtattg gaaactataa attaaataca gaccacgccg gtagcaacga caatattgct 
ttgctagtac agtaagtgac aacagatgtt tcatcttgtt gacttccagg ttacaatagc 
agagatattg attatcatta tgaggacttt caggattgct atttggaatc ttgacgttat 
aataagttca atagtgagac aattatttaa gcctctaact aagaagaatt attcggagtt 
agatgatgaa gaacctatgg agttagatta tccataaaac gaac atg aaa att att 
ace Lys Ile Ile 


ctc ttc ctg aca ttg att gta ttt aca tct tgc gag cta tat cac tat 
Leu Phe Leu Thr Leu aa Val Phe Thr Ser Cys Glu Leu Tyr His aur 
5 0 15 


cag gag tgt gtt aga ggt acg act gta cta cta aaa gaa cct tgc cca 
Gin Glu Cys Val arg Gly Thr Thr va) a Leu Lys Glu Pro 3 he Pro 
3 


tca gga aca tac gag g9c aat tca cca ttt cac cct ctt gct gac aat 
Ser Gly Thr Tyr Glu Gly Asn Ser Pro Phe His Pro Leu a Asp Asn 
40 45 


aaa ttt gca cta act tgc act agc aca cac ttt gct ttt gct tgt gct 
Lys Phe Ala Leu Thr Cys Thr Ser Thr His Phe Ala Phe Ala Cys Ala 
55 60 65 
gac ggt act cga cat acc tat cag ctg cgt gca aga tca gtt tca cca 
Asp Gly Thr Arg His Thr Tyr Glin Leu Arg Ala Arg Ser Val Ser Pro 
70 75 80 
aaa ctt ttc atc aga caa gag gag gtt caa caa gag ctc tac tcg cca 
Lys Leu Phe Ile Arg Gln Glu Glu Val Gin Gin Glu Leu Tyr Ser Pro 
85 90 95 100 
ctt ttt ctc att gtt gct gct cta gta ttt tta ata ctt tgc ttc acc 
Leu Phe Leu Ile Val Ala Ala Leu Val Phe Leu Ile Leu Cys Phe Thr 
105 110 115 
att aag aga aag aca gaa tgaatgagct cactttaatt gacttctatt 
Ile Lys Arg Lys Thr Glu 
120 
tgtgcttttt agcctttctg ctattccttg ttttaataat gcttattata ttttggtttt 
cactcgaaat ccaggatcta gaagaacctt gtaccaaagt ctaaacgaac atgaaacttc 
tcattgtttt gacttgtatt tctctatgca gttgcatatg cactgtagta cagcgctgtg 


catctaataa acctcatgtg cttgaagatc cttgtaaggt acaacactag gggtaatact 


111 


60 


120 


180 


240 


296 


344 


392 


440 


488 


536 


584 


632 


680 


740 


800 


860 
920 


20 


25 


30 


35 


40 


45 


50 


55 


tatagcactg 


atggttcaaa catgcacacc taatgttact 


cttatagcta ggtgttggta ccttcatgaa 


cttgttgttt 

acgtagtgcc 

tggaggacgc 
<210> 24 


<211> 122 
<212> PRT 


cttggctttg tgctctagga 


taaataaacg aacaaattaa 


ccccgcatta catttggtgg 


a 


<213> CORONAVIRUS 


<400> 24 


Met Lys Ile Ile 
1 


Leu Tyr His 


Glu Pro Cys 


Ala 
50 


Leu Asp 


Phe Ala 


65 


cys 


Ser Val Ser 


Leu Tyr Ser 


Phe 
115 


Leu cys 


<210> 25 
<211> 1231 
<212> DNA 


Tyr 
20 

Pro 
Asn 
Ala 
Pro 
Pro 


100 


Thr 


Leu 


Gin 


ser 


Lys 


Asp 


Lys 


Leu 


Ile 


<213> CORONAVIRUS 


<220> 
<221> CDS 


<222> (650)..(781) 


<223> 


<400> 25 


Phe 


Glu 


Gly 


Phe 


Gly 


70 


Leu 


Phe 


Lys 


Leu 


cys 


Thr 


Ala 


55 


Thr 


Phe 


Leu 


Arg 


EP 1 694 829 B1 


Thr 


val 


Tyr 


40 


Leu 


Arg 


Tle 


Tle 


Lys 


aaggttttac 


atcaactgtc 


ggtcaccaaa 


aatgtctgat 


acccacagat 


Leu 


Arg 


25 


Glu 


Thr 


His 


Arg 


val 


105 


Thr 


Tle 
10 

Gly 
Gly 
cys 
Thr 
Gln 
90 


Ala 


Glu 


112 


val 


Thr 


Asn 


Thr 


Tyr 


75 


Glu 


Ala 


cttttcatag 
aagatccagc 
ctgctgcatt 
aatggacccc 


tcaactgaca 


Phe Thr 


Thr val 


30 


Pro 
45 


ser 


Ser Thr 


60 


Gln Leu 


Glu Val 


Leu Val 


ser 


Leu 


Phe 


His 


Arg 


Gln 


Phe 


atggcacact 
tggtggtgcg 
tagagacgta 
aatcaaacca 


ataaccagaa 


cys Glu 


15 


Leu Lys 


His Pro 


Phe Ala 


Ala Arg 


80 


Gin Glu 


i 


Leu Ile 


110 


980 
1040 
1100 
1160 
1220 
1231 


20 


25 


30 


35 


40 


45 


50 


55 


taccgtattg 
ttgctagtac 
agagatattg 
aataagttca 
agatgatgaa 
tcctgacatt 
gtacgactgt 
ttcaccctct 
cttgtgctga 
ttttcatcag 


ctgctctagt 


act 
Thr 
5 


ctc 
Leu 


ctt 
Leu 
20 


gat 
Asp 


gtt 
Val 


cta 
Leu 
cattgttttg 
atctaataaa 
atagcactgc 
tggttcaaac 
ttatagctag 
ttgttgtttt 
cgtagtgccc 
ggaggacgca 
<210> 26 


<211> 44 
<212> PRT 


tta att 
Leu Ile 


tta ata 
Leu Ile 


gaa gaa 
Glu Glu 


gaaactataa 
agtaagtgac 
attatcatta 
atagtgagac 
gaacctatgg 
gattgtattt 
actactaaaa 
tgctgacaat 
cggtactcga 
acaagaggag 


atttttaata 


Asp 


atg 
Met 


cct 
Pro 
40 

acttgtattt 
cctcatgtgc 
ttggctttgt 
atgcacacct 
gtgttggtac 
aaataaacga 


cccgcattac 


<213> CORONAVIRUS 


<400> 26 


gac ttc tat 
Phe 


ctt 
Leu 
25 


tgt 
cys 
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attaaataca 
aacagatgtt 
tgaggacttt 
aattatttaa 
agttagatta 
acatcttgcg 
gaaccttgcc 
aaatttgcac 
catacctatc 
gttcaacaag 


ctttgcttca 


Tyr 
10 


att 
Ile 


acc 
Thr 
ctctatgcag 
ttgaagatcc 
gctctaggaa 
aatgttacta 
cttcatgaag 
acaaattaaa 


atttggtgga 


gaccacgccg 
tcatcttgtt 
caggattgct 
gcctctaact 
tccataaaac 
agctatatca 
catcaggaac 
taacttgcac 
agctgcgtgc 
agctctactc 


ccattaagag 


ttg tgc ttt tta 
Leu Cys Phe Leu 


ata ttt tgg ttt 
Ile Phe Trp ig 


ttgcatatgc 
ttgtaaggta 
aggttttacc 
tcaactgtca 
gtcaccaaac 
atgtctgata 


cccacagatt 


113 


gtagcaacga 
gacttccagg 
atttggaatc 
aagaagaatt 
gaacatgaaa 
ctatcaggag 
atacgagggc 
tagcacacac 
aagatcagtt 
gccacttttt 


caatattgct 
ttacaatagc 
ttgacgttat 
attcggagtt 
attattctct 
tgtgttagag 
aattcaccat 
tttgcttttg 
tcaccaaaac 


ctcattgttg 


aaagacaga atg aat gag 


“a Asn Glu 


gcc ttt ctg cta ttc 
ane Phe Leu Leu Phe 


tca ctc gaa atc cag 
Ser Leu Glu Ile Gin 
35 


actgtagtac 
caacactagg 
ttttcataga 
agatccagct 
tgctgcattt 
atggacccca 


caactgacaa 


aaa gtc taaacgaaca tgaaacttct 
Lys Val 


agcgctgtgc 
ggtaatactt 
tggcacacta 
ggtggtgcgc 
agagacgtac 
atcaaaccaa 


taaccagaat 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
658 


706 


754 


801 


861 
921 
981 
1041 
1101 
1161 
1221 
1231 


20 


25 


30 


35 


40 


45 


50 


55 
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Met ASn Glu Leu He Leu Ile Asp Phe ye Leu cys Phe Leu ne Phe 
1 


Leu Leu Phe Leu Val Leu Ile Met Leu Ile Ile Phe Trp Phe Ser Leu 
20 25 30 


Glu Ile om Asp Leu Glu Glu a cys Thr Lys val 


<210> 27 
<211> 1231 
<212> DNA 


<213> CORONAVIRUS 


<220> 
<221> CDS 


<222> (791)..(907) 


<223> 


<400> 27 


taccgtattg 
ttgctagtac 
agagatattg 
aataagttca 
agatgatgaa 
tectgacatt 
gtacgactgt 
ttcacectct 
cttgtgctga 
ttttcatcag 
ctgctctagt 
cactttaatt 
gcttattata 


ctaaacgaac 


gaaactataa 
agtaagtgac 
attatcatta 
atagtgagac 
gaacctatgg 
gattgtattt 
actactaaaa 
tgctgacaat 
cggtactcga 
acaagaggag 
atttttaata 
gacttctatt 
ttttggtttt 


attaaataca 
aacagatgtt 
tgaggacttt 
aattatttaa 
agttagatta 
acatcttgcg 
gaaccttgcc 
aaatttgcac 
catacctatc 
gttcaacaag 
ctttgcttca 
tgtgcttttt 


cactcgaaat 


gaccacgccg 
tcatcttgtt 
caggattgct 
gcctctaact 
tccataaaac 
agctatatca 
catcaggaac 
taacttgcac 
agctgcgtgc 
agctctactc 
ccattaagag 
agcectttctg 


ccaggatcta 


gtagcaacga 
gacttccagg 
atttggaatc 
aagaagaatt 
gaacatgaaa 
ctatcaggag 
atacgagggc 
tagcacacac 
aagatcagtt 
gccacttttt 
aaagacagaa 
ctattccttg 


gaagaacctt 


atg aaa ctt ctc att gtt ttg act tgt att tct 


114 


caatattgct 
ttacaatagc 
ttgacgttat 
attcggagtt 
attattctct 
tgtgttagag 
aattcaccat 
tttgcttttg 
tcaccaaaac 
ctcattgttg 
tgaatgagct 
ttttaataat 
gtaccaaagt 


cta tgc 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
829 


20 


25 


30 


35 


40 


45 


50 


55 
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a Lys Leu Leu ue Val Leu Thr cys ae Ser Leu Cys 
1 


agt tgc ata tgc act gta gta cag cgc tgt gca tct aat aaa cct cat 
ser as Ile cys Thr vat Val Gln Arg cys Ala oer Asn Lys Pro His 


20 


gtg ctt gaa gat cct tgt aag gta caa cac taggggtaat acttatagca 
vet Leu Glu Asp Pro Ne Lys Val Gin His 


ctgcttggct ttgtgctcta ggaaaggttt 
aaacatgcac acctaatgtt actatcaact 
ctaggtgttg gtaccttcat gaaggtcacc 
ttttaaataa acgaacaaat taaaatgtct 
gccccccgca ttacatttgg tggacccaca 
cgca 

<210> 28 

<211> 39 


<212> PRT 
<213> CORONAVIRUS 


<400> 28 


taccttttca 
gtcaagatcc 
aaactgctgc 
gataatggac 


gattcaactg 


tagatggcac actatggttc 
agctggtggt gcgcttatag 
atttagagac gtacttgttg 
cccaatcaaa ccaacgtagt 


acaataacca gaatggagga 


Met Lys Leu Leu Ile Val Leu Thr cys Ile Ser Leu Cys Ser Cys Ile 
1 5 10 15 


cys Thr val Ve Gin Arg Cys Ala oe Asn Lys Pro His te Leu Glu 


ASp Pro as Lys Val GIn His 


<210> 29 

<211> 1231 

<212> DNA 

<213> CORONAVIRUS 


<220> 
<221> CDS 

<222> (876)..(1127) 
<223> 


<400> 29 


115 


877 
927 


987 
1047 
1107 
1167 
1227 
1231 


20 


25 


30 


35 


40 


45 


50 


55 


taccgtattg 
ttgctagtac 
agagatattg 
aataagttca 
agatgatgaa 
tcctgacatt 
gtacgactgt 
ttcaccctct 
cttgtgctga 
ttttcatcag 
ctgctctagt 
cactttaatt 
gcttattata 
ctaaacgaac 


cactgtagta 


tac 
Tyr 


age 
25” 


gta 


agg 
Val 


Arg 


cta 
Leu 


gct 
Ala 


aca 


tgc 
Thr 


cys 
40 


aca 
Thr 


ctt 
Leu 


ata 


gcg 
Ile 


Ala 
55 


ttt 


gca 
Phe 


aga 
Ala 


Arg 


gaaactataa 
agtaagtgac 
attatcatta 
atagtgagac 
gaacctatgg 
gattgtattt 
actactaaaa 
tgctgacaat 
cggtactcga 
acaagaggag 
atttttaata 
gacttctatt 
ttttggtttt 
atgaaacttc 


cagcgctgtg 


act 
Thr 


aac 
Asn 
10 


aag 
Lys 


gtt 
Val 


cct 
Pro 


aat 
Asn 


gct 


agg 
Ala 


Arg 


agg 
Arg 


tta 
Leu 


gtt 
val 


tgt 
cys 
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attaaataca 
aacagatgtt 
tgaggacttt 
aattatttaa 
agttagatta 
acatcttgcg 
gaaccttgcc 
aaatttgcac 
catacctatc 
gttcaacaag 
ctttgcttca 
tgtgettttt 
cactcgaaat 
tcattgtttt 


catctaataa 


ggt aat 
Gly Asn 
cect 
Pro 


ttt 
Phe 
30 


atc 
Tle 


act 
Thr 
45 


tac 
Tyr 


tgg 
Trp 


60 


gac 
ASp 


gta 
val 
75 


ctt 
Leu 


gtt 


gtt 
Val 


Val 


gaccacgccg 
tcatcttgtt 
caggattgct 
gcctctaact 
tccataaaac 
agctatatca 
catcaggaac 
taacttgcac 
agctgcgtgc 
agctctactc 
ccattaagag 
agcctttctg 
ccaggatcta 


gacttgtatt 


gtagcaacga 
gacttccagg 
atttggaatc 
aagaagaatt 
gaacatgaaa 
ctatcaggag 
atacgagggc 
tagcacacac 
aagatcagtt 
gccacttttt 
aaagacagaa 
ctattccttg 
gaagaacctt 


tctctatgca 


acctc atg tgc ttg aag 
Met Cys Leu Lys 
1 


tat 
Tyr 


act 
Thr 
15 


cat 
His 


agc 
ser 


aga 
Arg 


tgg 
Trp 


aac 
Asn 


tgt 
cys 


caa 
Gin 


cat 
HIS 


ctt 
Leu 


gaa 
Glu 
65 


tta 
Leu 


aat 
Asn 
80 


aaa 
Lys 


taaaatgtct gataatggac cccaatcaaa ccaacgtagt 


tggacccaca gattcaactg acaataacca gaatggagga 


<210> 30 
<211> 84 
<212> PRT 


<213> CORONAVIRUS 


<400> 30 


116 


Thr 


Asp 


Arg 


act gct 


tgg 
Ala 


Trp 
20 


atg 
Met 


act 
Thr 
35 


cca 
Pro 


cac 
H1s 


gat gct 


Ala 
50 


aly 


cga 


cac 
His 


caa 
Gin 


aat 
Asn 


aca 
Thr 


gccccccgca 


cgca 


caatattgct 
ttacaatagc 
ttgacgttat 
attcggagtt 
attattctct 
tgtgttagag 
aattcaccat 
tttgcttttg 
tcaccaaaac 
ctcattgttg 
tgaatgagct 
ttttaataat 
gtaccaaagt 
gttgcatatg 
atc ctt 

Leu 


ctt 
Leu 


tgt 
cys 


caa 
Gin 


ety 


gct 
Ala 
70 


gtt 
val 


ety 
act 


Thr 


ttacatttgg 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
893 


941 


989 


1037 


1085 


1127 


1187 
1231 


20 


25 


30 


35 


40 


45 


50 


55 


Met cys Leu 
1 


Ser Thr Ala 


Thr 


Trp His 
35 


Gln Asp Pro 
50 


Glu Gly His 


65 


Lys Arg Thr 


<210> 31 
<211> 21221 
<212> DNA 


Lys Ile 


Trp Leu 


20 


Met Val 
Ala Gly 
Gln Thr 


Asn 


<213> CORONAVIRUS 


<400> 31 


atggagagcc 
cttcaggtta 
gaggcacgtg 
ctgccccagc 
cacggccaca 
ggtataacac 
gttcttcttc 
aagtcttatg 
tggaacacta 
gcagtcactc 
atcaaagatt 
tacatcgagt 
ttcactgagc 
aagaaatttg 
gtcaaagtca 


cgctctgtgt 


ttgttcttgg 
gagacgtgct 
aacacctcaa 
ttgaacagcc 
aggtcgttga 
tgggagtact 
gtaagaacgg 
acttaggtga 
agcatggcag 
gctatgtcga 
ttctcgcacg 
cgaagagagg 
gctctgataa 
acactttcaa 
ttcaaccacg 


accctgttgc 
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tgtcaacgag 
agtgcgtggc 
aaatggcact 
ctatgtgttc 
gctggttgca 
cgtgccacat 
taataaggga 
cgagcttggc 
tggtgcactc 
caacaatttc 
cgcgggcaag 
tgtctactgc 
gagctacgag 
aggggaatgc 
tgttgaaaag 


atctccacag 


Leu Val Arg Tyr Asn Thr 
10 
Cys Ala Leu Gly Lys val 
25 
Gln Thr Cys Thr Pro Asn 
40 
Gly ee Leu Ile Ala Arg 


Ala Ala Phe Arg Asp val 
70 75 


aaaacacacg 
ttcggggact 
tgtggtctag 
attaaacgtt 
gaaatggacg 
gtgggcgaaa 
gccggtggtc 
actgatccca 
cgtgaactca 
tgtggcccag 
tcaatgtgca 
tgccgtgacc 
caccagacac 
ccaaagtttg 
aaaaagactg 


gagtgtaaca 


117 


Arg 
Leu 


Val 
45 


cys 
60 


Leu 


tccaactcag 
ctgtggaaga 
tagagctgga 
ctgatgcctt 
gcattcagta 
ccccaattgc 
atagctatgg 
ttgaagatta 
ctcgtgagct 
atgggtaccc 
ctctttccga 
atgagcatga 
ccttcgaaat 
tgtttcctct 
agggtttcat 


atatgcactt 


Gly Asn Thr 
15 
Pro Phe His 
30 
Thr Ile Asn 
Trp Tyr Leu 


val val Leu 


Tyr 


Arg 


cys 


His 


Asn 
80 


tttgcctgtc 
ggccctatcg 
aaaaggcgta 
aagcaccaat 
cggtcgtagc 
ataccgcaat 
catcgatcta 
tgaacaaaac 
caatggaggt 
tcttgattgc 
acaacttgat 
aattgcctgg 
taagagtgcc 
taactcaaaa 
ggggcgtata 
gtctaccttg 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 


20 


25 


30 


35 


40 


45 


50 


55 


atgaaatgta 
tgtgaacatt 
cctactaatg 
gagcatagtg 
ggtaggacta 
gcctactggg 
gacaatgtgg 
attaacattg 
tetgcttcta 
accattgttg 
tggaacattg 
gctggtgtta 
gatttgcaaa 
gtcgacgcca 
gtaactggtg 
gttgaaaaac 
tttctcaagg 
aagggtcaaa 
gttgttaaca 
cgatcactca 
atacgtggca 
tttcttgaag 
ggtgaactcg 
acaccagtct 
gcattgtctc 
attaaaggtg 
agaatcacat 
tacactgttg 
gtgaagactt 
tggagtgtag 
atgtattgtt 
gaagaaattg 
cctctggaat 


tggctggatg 


atcattgcga 
gtggcactga 
ctgtagtgaa 
ttgcagatta 
gatgttttgg 
ttcctcgtgc 
agaccttgaa 
ttggcgattt 
caagtgcctt 
agtcctgcgg 
gacaacagag 
tcagatcaat 
gagcagctgt 
tggtttatac 
gtcttgtaca 
tcaggectat 
atgcttggga 
tacaggttgc 
aggcactcga 
acttaggtga 
aggagcagct 
gtgattcaca 
aagcactcga 
gtgtaaatgg 
ctggtttact 
taacctttgg 
ttgagcttga 
aatccggtac 
tacaaccagt 
ctacattcta 
ccttttaccc 
atgaaacctg 
ttggtgcctc 


atactactga 
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tgaagtttca 
aaatttagtt 
aatgccatgt 
tcacaaccac 
aggctgtgtg 
tagtgctgat 
tgaggatctc 
tcatttgaat 
tattgacact 
taactataaa 
atcagtttta 
ttttgcgcgc 
caccatactt 
ttcagacctg 
acagacttct 
ctttgaatgg 
gattctcaaa 
ttcagataac 
aatgtgcatt 
agtcttcatc 
gcaactactc 
tgacacagta 
gacgcccgtt 
cctcatgctc 
ggctacaaac 
agaagatact 
tgaacgtgtt 
cgaagttact 
ttctgatctc 
cttatttgat 
tccagatgag 
tgaacatgag 
agctgaaaca 


gcaatcagag 


tggcagacgt 
attgaaggac 
cctgcctgtc 
tcaaacattg 
tttgcctatg 
attggctcag 
cttgagatac 
gaagaggttg 
ataaagagtc 
gttaccaagg 
acaccactgt 
acacttgatg 
gatggtattt 
ctcaccaaca 
cagtggttgt 
attgaggcga 
tttctcatta 
atcaaggatt 
gatcaagtca 
gctcaaagca 
atgcctctta 
cttacctctg 
gatagcttca 
ttagagatta 
aatgtctttc 
gtttgggaag 
gacaaagtgc 
gagtttgcat 
cttaccaaca 
gatgctggtg 
gaagaagagg 
tacggtacag 
gttcgagttg 


attgagccag 


118 


gcgactttct 
ctactacatg 
aagacccaga 
aaactcgact 
ttggctgcta 
gccatactgg 
tgagtcgtga 
ccatcatttt 
ttgattacaa 
gaaagcccgt 
gtggttttcc 
cagcaaacca 
ctgaacagtc 
gtgtcattat 
ctaatctttt 
aacttagtgc 
caggtgtttt 
gtgtaaaatg 
ctatcgctgg 
agggacttta 
aggcaccaaa 
aggaggttgt 
caaatggagc 
aggacaaaga 
gcttaaaagg 
ttcaaggtta 
ttaatgaaaa 
gtgttgtagc 
tgggtattga 
aagaaaactt 
acgatgcaga 
aggatgatta 
aggaagaaga 


aaccagaacc 


gaaagccact 
tgggtaccta 
gattggacct 
ccgcaaggga 
taataagcgt 
cattactggt 
acgtgttaac 
ggcatctttc 
gtctttcaaa 


aaaaggtgct 


ctcacaggct. 


ctcaattcct 
attacgtctt 
tatggcatat 
gggcactact 
aggagttgaa 
tgacatcgtc 
cttcattgat 
cgcaaagttg 
ccgtcagtgt 
agaagtaacc 
tctcaagaac 
tatcgttggc 
acaatactgc 
gggtgcacca 
caagaatgtg 
gtgctctgtc 
agaggctgtt 
tcttgatgag 
ttcatcacgt 
gtgtgaggaa 
tcaaggtctc 
agaggaagac 


tacacctgaa 


1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 


20 


25 


30 


35 


40 


45 


50 


55 


gaaccagtta 
gttgacatcg 
atacacctga 
atgcaaaagg 
tgtttgcttt 
aatgcaggtg 
atcttacttg 
caagtgtgcg 
tatgagcagg 
caagaggagc 
cctgtcgatg 
gaaactaagt 
catgattctc 
tacatggtag 
aaggctggtg 
tatataacca 
gctcttaaga 
gaagagattc 
acaagaaaat 
aagtataaag 
tatactagta 
cttgtcacaa 
tgtatgcgtt 
acatataatg 
gtttctttgg 
gttgaatttc 
tttcatcttg 
gaggttaaga 
gtggatatgt 
gttacaaaaa 
gatgacacac 
ggtaggtaca 
ttaacttcaa 


caacagcttg 


atcagtttac 
ttaaggaggc 
aacatggtgg 
agagtgatga 
ctggacataa 
aggacatcca 
caccattgtt 
tgcagacggt 
ttgtcatgga 
caccaaacac 
tgaagccaaa 
ttcttaccaa 
agaacatgct 
gtgatgttat 
gcactactga 
cgtaccctgg 
aatgcaaatc 
taggaactgt 
taatgcectat 
gaattaaaat 
aagagcctgt 
tgccaattgg 
ctcttaaage 
gatacctcac 
ctggctctta 
ttaagcgtgg 
acggtgaggt 
ctataaaagt 
ctatgacata 
ttaaacctca 
tacgtagtga 
tgtctgcttt 
ttaaatgggc 


aagtcaaatt 
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tggttattta 
acaaagtgct 
tggtgtagca 
ttacattaag 
tcttgctaag 
gcttcttaag 
gtcagcagge 
tcgtacacag 
ttatcttgat 
agaagattcc 
aattaaggcc 
taagttactc 
tagaggtgaa 
cactagtggt 
gatgctctca 
acaaggatgt 
tgcattttat 
atcctggaat 
atgcatggat 
tcaagagggc 
agcttctatt 
ttatgtgaca 
tcctgccgta 
ttcgtcatca 
cagagattgg 
tgacaaaatt 
tctttcactt 
gttcacaact 
tggacagcag 
tgtaaatcat 
agctttcgag 
aaaccacaca 
tgataacaat 


caatgcacca 


aaacttactg 
aatcctatgg 
ggtgcactca 
ctaaatggcc 
aagtgtctgc 
gcagcatatg 
atatttggtg 
gtttatattg 
aacctgaagc 
aaaactgagg 
tgcattgatg 
ttgtttgctg 
gatatgtctt 
gatatcactt 
agagctttga 
gctggttata 
gtactacctt 
ttgagagaaa 
gttagagcca 
atcgttgact 
attacgaagc 
catggtttta 
gtgtcagtat 
aagacatctg 
tectattcag 
gtgtaccaca 
gacaaactaa 
gtggacaaca 
tttggtccaa 
gagggtaaga 
tactaccata 
aagaaatgga 
tgttatttgt 


gcacttcaag 


119 


acaatgttgc 
tgattgtaaa 
acaaggcaac 
ctcttacagt 
atgttgttgg 
aaaatttcaa 
ctaaaccact 
cagtcaatga 
ctagagtgga 
agaaatctgt 
aggttaccac 
atatcaatgg 
tccttgagaa 
gtgttgtaat 
agaaagtgcc 
cacttgagga 
cagaagcacc 
tgcttgctca 
taatggcaac 
atggtgtccg 
tgaactctct 
atcttgaaga 
catcaccaga 
aggagcactt 
gacagcgtac 
ctctggagag 
agagtctctt 
ctaatctcca 
catacttgga 
ctttctttgt 
ctcttgatga 
aatttcctca 
ctagtgtttt 


aggcttatta 


cattaaatgt 
tgctgctaac 
caatggtgcc 
aggagggtct 
acctaaccta 
ttcacaggac 
tcagtcttta 
caaagctctt 
agcacctaaa 
cgtacagaag 
aacactggaa 
taagctttac 
ggatgcacct 
accctccaaa 
agttgatgag 
agctaagact 
taatgctaag 
tgctgaagag 
catccaacgt 
attcttcttt 
aaatgagccg 
ggctgcgcge 
tgctgttact 
tgtagaaaca 
agagttaggt 
ccccgtcgag 
atccctgcgg 
cacacagctt 
tggtgctgat 
actacctagt 
gagttttctt 
agttggtggt 
attagcactt 


tagagcccgt 


3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 


20 


25 


30 


35 


40 


45 


50 


55 


gctggtgatg 
gagcttggtg 
gcaaagcgag 
ggtgtagaag 
tccattccat 
tttgttatga 
gcgaatgagt 
accctctatc 
actgatgttt 
ctcgatggag 
aatgcttact 
agttttgata 
atgacaggct 
aatggcgatg 
aaattactgc 
aaaccaaaca 
tcatttgaag 
Ccaacaaccca 
tgtgacgtga 
gttaaagtaa 
agcattacca 
actcatggta 
ccattcttag 
gtgtttaaca 
aaaagtacca 
aagagtgttg 
tctaaattgt 
atctgtgtaa 
aatggcgtta 
ggttcttttc 
cttgaaacca 
gccgctgagt 
tcagctataa 


ctcatgtggt 


ctgctaactt 
atgtcagaga 
ttcttaatgt 
ctgtgatgta 
gtgtgtgtgg 
tgtctgcacc 
acactggtaa 
gtattgacgg 
tctacaagga 
ttacttacac 
atacagagca 
atttcaaact 
tcacaaagec 
tagtggctat 
ataagccaat 
cttggtgttt 
ttctggcagt 
cctctgaaga 
aaactaccga 
cacaagagtt 
ttaagaaacc 
ttgctgcaat 
gacaagcagc 
attatatgcc 
attctagaat 
ctaaattatg 
tcacaatcgc 
ctgctgcttt 
gagaattgta 
cttgcagcat 
ttcaggtgac 
gggttttggc 
tgcaggtgtt 


ttatcattag 
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ttgtqcactc 
aactatgacc 
ggtgtgtaaa 
tatgggtact 
tcgtgatgct 
acctgctgag 
ctatcagtgt 
agctcacctt 
aacatcttac 
agagattgaa 
gcctatagac 
cacatgttct 
agcttcacga 
tgactataga 
tgtttggcac 
acgttgtctt 
agaagacaca 
agtagtggaa 
agttgtaggc 
aggtcatgag 
taatgagctt 
taatagtgtt 
aattacaaca 
ttatgtgttt 
tagagcttca 
tttggatgcc 
tatgtggcta 
tggtgtactc 
tcttaattcg 
ttgtttaagt 
gatttcatcg 
atatatgttg 
ctttggctat 


tattgtacaa 


atactcgctt 
catcttctac 
cattgtggtc 
ctatcttatg 
acacaatatc 
tataaattac 
ggtcattaca 
acaaagatgt 
actacaacca 
ccaaaattgg 
cttgtaccaa 
aacacaaaat 
gagctatctg 
cactattcag 
attaaccagg 
tggagtacaa 
caaggaatgg 
aatcctacca 
aatgtcatac 
gatcttatgg 
tcactagcct 
ccttggagta 
tcaaattgcg 
acattattgt 
ctacctacaa 
ggcattaatt 
ttgttgttaa 
ttatctaatt 
tctaacgtta 
ggattagact 
tacaagctag 
ttcacaaaat 
tttgctagtc 


atggcacccg 


120 


acagtaataa 
agcatgctaa 
agaaaactac 
ataatcttaa 
tagtacaaca 
agcaaggtac 
ctcatataac 
cagagtacaa 
tcaagcctgt 
atgggtatta 
ctcaaccatt 
ttgctgatga 
tcacattctt 
cgagtttcaa 
ctacaaccaa 
agccagtaga 
acaatcttgc 
tacagaagga 
ttaaaccatc 
ctgcttatgt 
taggtttaaa 
aaattttggc 
ctaagagatt 
tccaattgtg 
ctattgctaa 
atgtgaagtc 
gtatttgctt 
ttggtgctcc 
ctactatgga 
cccttgattc 
acttgacaat 
tcttttattt 
atttcatcag 


tttctgcaat 


aactgttggc 
tttggaatct 
taccttaacg 
gacaggtgtt 
agagtcttct 
attcttatgt 
tgctaaggag 
aggaccagtg 
gtcgtataaa 
taaaaaggat 
accaaatgcg 
tttaaatcaa 
cccagacttg 
gaaaggtgct 
gacaacgttc 
tacttcaaat 
ttgtgaaagt 
agtcatagag 
agatgaaggt 
ggaaaacaca 
aacaattgcc 
ttatgtcaaa 
agcacaacgt 
tacttttact 
aaatagtgtt 
acccaaattt 
aggttctcta 
trcttattgt 
tttctgtgaa 
ttatccagct 
tttaggtctg 
attaggtctt 
caattcttgg 
ggttaggatg 


5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 


20 


25 


30 


35 


40 


45 


50 


55 


tacatcttct 
tgcacctctt 
acaactattg 
ttctgcaaga 
ttcattagtg 
actgaccagt 
tactttgaca 
ttagacaatt 
gatggcaagt 
ctgatgtgcc 
actgaagttt 
gttcctatgg 
gtagctttag 
accgatgttg 
gaagtgacag 
acgcccagag 
gcaaaaagtc 
cagctgcgta 
tgtgctacaa 
aagattgtta 
gcattggttt 
aatgaaatca 
gatgattgtt 
tcatacaaaa 
ttcatagtgc 
tttctacctc 
gagtatagtg 
gatgctatgg 
tcttatagtg 
tttcctaaca 
tgtagacatg 
tgggttctta 
atgaatctca 


tctgcttcag 


ttgcttcttt 
cgacttgcat 
ttaatggcat 
ctcacaattg 
atgaagttgc 
catcgtatat 
aggctggtca 
tgagagctaa 
ccaaatgcga 
aacctattct 
ccgttaagat 
aaaaacttaa 
atggtgtcct 
acacaaagga 
gtgacagttg 
atcttggcgc 
acaatgtttc 
aacaaattcg 
ctagacaggt 
gtacttgttt 
gttatatcgt 
ttggttacaa 
ttgcaaataa 
atgacaaaag 
ctggcttacc 
gtgtttttag 
attttgctac 
gcaaacctgt 
agcttcgtcc 
cttacctgga 
gtacatgcga 
ataatgagca 
tagctaacat 


tagtggctgg 
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ctactacata 
gatgtgctat 
gaagagatct 
gaattgtctc 
tcgtgatttg 
tgttgatagt 
aaagacctat 
caacactaaa 
cgagtctgct 
gttgcttgac 
gtttgatgct 
ggcacttgtt 
ttctacattc 
tgttattgaa 
taacaatttc 
atgtattgac 
actcatctgg 
tagtgctgcc 
tgtcaatgtc 
taaacttatg 
tatgccagta 
agccattcag 
acatgctggt 
ctgccctgta 
gggtactgtg 
tgctgttggc 
ctctgcttge 
gccatattgt 
agacactcgt 
gggttctgtt 
aaggtcagaa 
ttacagagct 
ctttactcct 
tagtattatt 


tggaagagct 
aagcgcaatc 
ttctatgtct 
aattgtgaca 
tcactccagt 
gttgctgtga 
gagagacatc 
ggttcactgc 
tctaagtctg 
Ccaagctcttg 
tatgtcgaca 
gctacagctc 
gtgtcagctg 
tgtctcaaac 
atgctcacct 
tgtaatgcaa 
aatgtaaaag 
aagaagaaca 
ataactacta 
cttaaggcca 
catacattgt 
gatggtgtca 
tttgacgcat 
gtagctgcta 
ctgagagcaa 
aacatttgct 
gttcttgctg 
tatgacacta 
tatgtgctta 
agagtagtaa 
gtaggtattt 
ctatcaggag 
cttgtgcaac 
gccatattgg 


121 


atgttcatat 
gtgccacacg 
atgcaaatgg 
cattttgcac 
ttaaaagacc 
aaaatggcgc 
cgctctccca 
ctattaatgt 
cttctgtgta 
tatcagacgt 
ccttttcagc 
acagcgagtt 
cccgacaagg 
tttcacatca 
ataataaggt 
ggcatatcaa 
actacatgtc 
acataccttt 
aaatctcact 
cattattgtg 
caatccatga 
ctcgtgacat 
ggtttagcca 
tcattacaag 
tcaatggtga 
acacaccttc 
ctgagtgtac 
atttgctaga 
tggatggttc 
caacttttga 
gcctatctac 
ttttctgtgg 
ctgtgggtgc 
tgacttgtgc 


catggatggt 
cgttgagtgt 
aggccgtggc 
tggtagtaca 
aatcaaccct 
gcttcacctc 
ttttgtcaat 
catagttttt 
ctacagtcag 
tggagatagt 
aacttttagt 
agcaaagggt 
tgttgttgat 
ctctgactta 
tgaaaacatg 
tgcccaagta 
tttatctgaa 
tagactaact 
caagggtggt 
cgttcttgct 
tggttacaca 
catttctact 
gcgtggtggt 
agagattggt 
cttcttgcat 
caaactcatt 
aatttttaag 
gggttctatt 
catcatacag 
tgctgagtac 
cagtggtaga 
tgttgatgcg 
tttagatgtg 


tgcctactac 


7140 
7200 
7260 
7320 
7380 
7440 
7500 
7560 
7620 
7680 
7740 
7800 
7860 
7920 
7980 
8040 
8100 
8160 
8220 
8280 
8340 
8400 
8460 
8520 
8580 
8640 
8700 
8760 
8820 
8880 
8940 
9000 
9060 
9120 


20 


25 


30 


35 


40 


45 


50 


55 


tttatgaaat 
ttgtttttga 
gtctactcag 
gctcaccttc 
tatgtattct 
agagtcatgt 
ttgctcaaca 
tataacaggt 
accagctatc 
tcaggtgctg 
agtggtttta 
acctgtggaa 
catgtcattt 
aaatccaacc 
tctatgcaaa 
tataaatttg 
tcaccatctg 
cttaatggat 
tatatgcatc 
ttctatggtc 
acattaaatg 
aatagattca 
cctttgacac 
gtcttagata 
atccttggta 
tctggtgtta 
cttttaactt 
ttctttgttt 
tgtgctatgc 
cttgcaacag 
atgacataggc 
atgtatgctt 
gctgctagac 
ggtaatgctt 


tcagacgtgt 
tgtctttcac 
tcttttactt 
aatggtttgc 
gtatttctct 
ttaatggagt 
aggaaatgta 
atcttgctct 
gtgaagcage 
atgttctcta 
ggaaaatggc 
ctacaactct 
gcacagcaga 
atagctttct 
attgtctgct 
tccgtatcca 
gtgtttatca 
catgtggtag 
atatggagct 
catttgttga 
ttttggcatg 
ccactacttt 
aagatcatgt 
tgtgtgctgc 
gcactatttt 
ccttccaagg 
tcttgacatc 
acgagaatgc 
tgcttgttaa 
ttgcttactt 
ttgaattggc 
cagctttagt 
gtgtttggac 


tagatcaagce 
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ttttggtgag 
tatactctgt 
gtacttgaca 
catgttttct 
gaagcactgc 
tacatttagt 
cctaaaattg 
atataacaag 
ttgctgccac 
ccaaccacca 
attcccgtca 
taatggattg 
agacatgctt 
tgttcaggct 
taggcttaaa 
acctggtcaa 
gtgtgccatg 
tgttggtttt 
tccaacagga 
cagacaaact 
gctgtatgct 
gaatgacttt 
tgacatattg 
tttgaaagag 
agaagatgag 
taagttcaag 
actattgatt 
tttcttgcca 
gcataagcac 
taatatggtc 
tgacactagc 
tttgcttatt 
actgatgaat 
tatttccatg 


tacaaccatg 
ctggtaccag 
ttctatttca 
cctattgtgc 
cattggttct 
accttcgagg 
cgtagcgaga 
tacaagtatt 
ttagcaaagg 
cagacatcaa 
ggcaaagttg 
tggttggatg 
aatcctaact 
ggcaatgttc 
gttgatactt 
acattttcag 
agacctaatc 
aacattgatt 
gtacacgctg 
gcacaggctg 
gctgttatca 
aaccttgtgg 
ggacctcttt 
ctgctgcaga 
tttacaccat 
aaaattgtta 
cttgttcaaa 
tttactcttg 
gcattcttgt 
tacatgcctg 
ttgtctggtt 
ctcatgacag 
gtcattacac 


tgggccttag 


122 


ttgttgctgc 
cttacagctt 
ccaatgatgt 
ctttttggat 
ttaacaacta 
aggctgcttt 
cactgttgcc 
tcagtggagc 
ctctaaatga 
tcacttctgc 
aagggtgcat 
acacagtata 
atgaagatct 
aacttcgtgt 
ctaaccctaa 
ttctagcatg 
ataccattaa 
atgattgcgt 
gtactgactt 
caggtacaga 
atggtgatag 
caatgaagta 
ctgctcaaac 
atggtatgaa 
ttgatgttgt 
agggcactca 
gtacacagtg 
gtattatggc 
gcttgtttct 
ctagctgggt 
ataggcttaa 
ctcgcactgt 
ttgtttacaa 
ttatttctgt 


taatgcactt 
tctgccggga 
ttcattcttg 
aacagcaatc 
tcttaggaaa 
gtgtaccttt 
acttacacag 
cttagatact 
ctttagcaac 
tgttctgcag 
ggtacaagta 
ctgtccaaga 
gctcattcgc 
tattggccat 
gacacccaag 
ctacaatggt 
aggttctttc 
gtctttctgc 


agaaggtaaa 


cacaaccata 
gtggtttctt 
caactatgaa 
aggaattgcc 
tggtcgtact 
tagacaatgc 
tcattggatg 
gtcactgttt 
aattgctgca 
gttaccttct 
gatgcgtatc 
ggattgtgtt 
ttatgatgat 
agtctactat 


aacctctaac 


9180 
9240 
9300 
9360 
9420 
9480 
9540 
9600 
9660 
9720 
9780 
9840 
9900 
9960 
10020 
10080 
10140 
10200 
10260 
10320 
10380 
10440 
10500 
10560 
10620 
10680 
10740 
10800 
10860 
10920 
10980 
11040 
11100 
11160 


20 


25 


30 


35 


40 


45 


50 


55 


tattctggtg 
gagtattacc 
tgtttcttag 
ttcaggctta 
aactcccagg 
ttgttgggta 
gacgtaaagt 
tcttctaaat 
acaactgaag 
gctgtagaca 
attgcttcag 
tatgagcagg 
ttgaatgtgqg 
atggcagatc 
aaagtaacta 
gcacttaaca 
ttgactacag 
tgtgatggta 
gcggatagca 
tggcctctta 
ctgagtccag 
actgatgaca 
ttactatcag 
acaatttaca 
aaagtgaaat 
ggcagtttag 
tcaactgtgc 
ctagcaagtg 
acaggacagg 


gcttcatgtt 


gacttgaaag 


acacttagaa 
gaccaactcc 


gcggtgtaag 


tcgttacgac 
cattgttatt 
gctattgttg 
ctcttggtgt 
ggcttttgcc 
ttggaggtaa 
gcacatctgt 
tgtgqggcaca 
ctttcgagaa 
ttaataggtt 
aatttagttc 
ctgtagctaa 
ctaaatctga 
aggctatgac 
gtgctatgca 
acattatcaa 
cagccaaact 
acacctttac 
agattgttca 
ttgttacagc 
tagcactacg 
atgcacttgc 
accaccaaga 
cagaactgga 
acttgtactt 
ctgctacagt 
tttccttctg 
gaggacaacc 
caattactgt 
gtctgtattg 
gtaagtacgt 
acacagtctg 
gcgaaccctt 


tgcagcccgt 


EP 1 694 829 B1 


tatcatgttt 
tattactggc 
ctgctgctac 
ttatgactac 
tcctaagagt 
accatgtatc 
ggtactgctc 
atgtgtacaa 
gatggtttct 
gtgcgaggaa 
tttaccatca 
tggtgattct 
gtttgaccgt 
ccaaatgtac 
aacaatgctc 
caatgcgcgt 
catggttgtt 
atatgcatct 
acttagtgaa 
tctaagagcc 
acagatgtcc 
ctactataac 
tctcaaatgg 
accaccttgt 
catCcaaaggc 
acgtcttcag 
tgcttttgca 
aatcaccaac 
aacaccagaa 
tagatgccac 
ccaaatacct 
taccgtctgc 
gatgcagtct 


cttacaccgt 


ttagctagag 
aacaccttac 
tttggcecttt 
ttggtctcta 
agtattgatg 
aaggttgcta 
tcggttcttc 
ctccacaatg 
cttttgtctg 
atgctcgata 
tatgccgctt 
gaagtcgttc 
gatgctgceca 
aaacaggcaa 
ttcactatgc 
gatggttgtg 
gtccctgatt 
gcactctggg 
attaacatgg 
aactcagctg 
tgtgcggctg 
aattcgaagg 
gctagattcc 
aggtttgtta 
ttaaacaacc 
gctggaaatg 
gtagaccctg 
tgtgtgaaga 
gctaacatgg 
attgaccatc 
accacttgtg 
ggaatgtgga 
gcggatgcat 
gcggcacagg 


123 


ctatagtgtt 
agtgtatcat 
tctgtttact 
cacaagaatt 
ctttcaagct 
ctgtacagtc 
aacaacttag 
atattcttct 
ttttgctatc 
accgtgctac 
atgccactgc 
tcaaaaagtt 
tgcaacgcaa 
gatctgagga 
ttaggaagct 
ttccactcaa 
atggtaccta 
aaatccagca 
acaattcacc 
ttaaactaca 
gtaccacaca 
gaggtaggtt 
ctaagagtga 
cagacacacc 
taaatagagg 
ctacagaagt 
ctaaagcata 
tgttgtgtac 
accaagagtc 
caaatcctaa 
ctaatgaccc 
aaggttatgg 
caacgttttt 


cactagtact 


tgtgtgtgtt 
gcttgtttat 
caaccgttac 
taggtatatg 
taacattaag 
taaaatgtct 
agtagagtca 
tgcaaaagac 
catgcagggt 
tcttcaggct 
ccaggaggcc 
aaagaaatct 
gttggaaaag 


caagagggca 


tgataatgat- 


catcatacca 
Caagaacact 
agttgttgat 
aaatttggct 
gaataatgaa 
aacagcttgt 
tgtgctggca 
tggtacaggt 
aaaagggcct 
tatggtgctg 
acctgccaat 
taaggattac 
acacactggt 
ctttggtggt 
aggattctgt 
agtgggtttt 
ctgtagttgt 
aaacgggttt 
gatgtcgtct 


11220 
11280 
11340 
11400 
11460 
11520 
11580 
11640 
11.700 
11760 
11820 
11880 
11940 
12000 
12060 
12120 
12180 
12240 
12300 
12360 
12420 
12480 
12540 
12600 
12660 
12720 
12780 
12840 
12900 
12960 
13020 
13080 
13140 
13200 


20 


25 


30 


35 


40 


45 


50 


55 


acagggcttt 
attgctgtcg 
ttaagaggca 
attgtccagce 
cacatatatc 
gtcattttga 
gtgatgatga 
tacgcgtata 
tctgcgatgc 
ttaatgggaa 
ctattgtgga 
ctgctgagtc 
aatatgattt 
agacatacca 
actttaatgt 
aaatatttgt 
gagtcgtaca 
tagtgtatgc 
gcactacatg 
ccggtaattt 
gaagttctgt 
attatgacta 
tagttgaagt 
aagtaatcgt 
ctagacttta 
agcgtaatgt 
atagagctcg 
atcagaaatt 
gcaagtttta 
cacaccttat 
taatggcctc 
tctacaggtt 
cactatatgt 
gtgtctttaa 


tgatatttac 
cttccaggag 
tactatgtct 
ggttgctgtc 
acgtcagcgt 
tgagggtaat 
ttatttcaat 
tgctaactta 
tatgcgtgat 
ctggtacgat 
ttcatattac 
ccatatggat 
tacggaagag 
tcccaattgt 
gttattttct 
agatggtgtt 
taatcaggat 
tgctgatcca 
cttttcagta 
taataaagac 
tgaactaaaa 
ttatcgttat 
tgttgataaa 
taacaatctg 
ttatgactca 
catcectact 
caccgtagct 
attgaagtca 
cggtggctgg 
gggttgggat 
tcttgttctt 
agctaacgag 
taaaccaggt 


catttgtcaa 
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aacgaaaaag 
aaggatgagg 
aactaccaac 
catgactttt 
ctaactaaat 
tgtgatacat 
aagaaggatt 
ggtgagcgtg 
gcaggcattg 
ttcggtgatt 
tcattgctga 
gctgatctcg 
agactttgtc 
attaactgtt 
actgtgtttc 
ecttttgttg 
gtaaacttac 
gctatgcatg 
gctgcactaa 
ttttatgact 
cacttcttct 
aatctgccaa 
tactttgatt 
gataaatcag 
atgagttatg 
ataactcaaa 
ggtgtctcta 
atagccgcca 
cataatatgt 
tatccaaaat 
gctcgcaaac 
tgtgcgcaag 
ggaacatcat 


gctgttacag 


ttgctggttt 
aaggcaattt 
atgaagagac 
tcaagtttag 
acacaatggc 
taaaagaaat 
ggtatgactt 
tacgccaatec 
taggcgtact 
tcgtacaagt 
tgcccatcct 
caaaaccact 
tcttcgaccg 
tggatgatag 
cacctacaag 
tttcaactgg 
atagctcgcg 
cagcttctgg 
caaacaatgt 
ttgctgtgtc 
ttgctcagga 
caatgtgtga 
gttacgatgg 
ctggtttccc 
aggatcaaga 
tgaatcttaa 
tctgtagtac 
ctagaggagc 
taaaaactgt 
gtgacagage 
ataacacttg 
tattaagtga 
ccggtgatgce 


ccaatgtaaa 


124 


tgcaaagttc 
attagactct 
tatttataac 
agtagatggt 
tgatttagtc 
actcgtcaca 
cgtagagaat 
attattaaag 
gacattagat 
agcaccaggc 
cactttgact 
tattaagtgg 
ttattttaaa 
gtgtatcctt 
ttttggacca 
ataccatttt 
tctcagtttc 
caatttattg 
tgcttttcaa 
taaaggtttc 
tggcaacgct 
tatcagacaa 
togctgtatt 
atttaataaa 
tgcacttttc 
gtatgccatt 
tatgacaaat 
tactgtggta 
ttacagtgat 
catgcctaac 
ctgtaactta 
gatggtcatg 
tacaactgct 


tgcacttctt 


ctaaaaacta 
tactttgtag 
ttggttaaag 
gacatggtac 
tatgctctac 
tacaattgct 
cctgacatct 
actgtacaat 
aatcaggatc 
tgcggagttc 
agggcattgg 
gatttgctga 
tattgggacc 
cattgtgcaa 
ctagtaagaa 
cgtgagttag 
aaggaacttt 
ctagataaac 
actgtcaaac 
tttaaggaag 
gctatcagtg 
ctcctattcg 
aatgccaacc 
tggggtaagg 
gcgtatacta 
agtgcaaaga 
agacagtttc 
attggaacaa 
gtagaaactc 
atgcttagga 
tcacaccgtt 
tgtggcggct 
tatgctaata 
tcaactgatg 


13260 
13320 
13380 
13440 
13500 
13560 
13620 
13680 
13740 
13800 
13860 
13920 
13980 
14040 
14100 
14160 
14220 
14280 
14340 
14400 
14460 
14520 
14580 
14640 
14700 
14760 
14820 
14880 
14940 
15000 
15060. 
15120 
15180 
15240 


20 


25 


30 


35 


40 


45 


50 


55 


gtaataagat 
atagaaatag 
atttctccat 
ctcaaggttt 
tgttcatgtc 
tttgctcaca 
cagatccatc 
gtacacttat 
atcctaatca 
atgatgagct 
cctcacggta 
aggctgtagg 
ttaggagacc 
aattagtgtt 
tgacacaact 
gttttccatt 
gtgacaatgt 
acatacttgc 
ccactgagga 
acagagaatt 
atgtctttac 
ttgaaaaagg 
atgttggtga 
tagtgccaca 
atgagttttc 
tccaaggacc 
catctgctcg 
aggcattaaa 
tagagtgttt 
taaatgcatt 
ctaattatga 
gcgatcctge 
aatattttaa 


cttgtcgccg 


agctgacaag 
ggatgttgat 
gatgattctt 
agtagctagc 
tgaggcaaaa 
gcatacaatg 
aagaatatta 
gattgaaagg 
ggagtatgct 
tactggccac 
ctgggaacct 
tgcttgtgta 
attcctatgt 
gtctgttaat 
gtatctagga 
atgtgctaat 
cactgacttc 
caacacttgt 
aacatttaag 
gcatctttca 
tggttaccgt 
tgactatggt 
ttactttgtg 
agagcactat 
tagcaatgtt 
acctggtact 
catagtgtat 
atatttgecc 
tgataaattc 
gccagaaaca 
cttgagtgtt 
tcaattacca 
ttcagtgtgc 


ttgtcctgct 
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tatgtccgca atctacaaca caggctctat 


catgaattcg 
tctgatgatg 
attaagaact 
tgttggactg 
ctagttaaac 
ggcgcaggct 
ttcgtgtcac 
gatgtctttc 
atgttggaca 
gagttttatg 
ttgtgcaatt 
tgcaagtgct 
ccctatgttt 
ggtatgagct 
ggtcaggttt 
aatgcgatag 
actgagagac 
ctgtcatatg 
tgggaggttg 
gtaactaaaa 
gatgctgttg 
ttgacatctc 
gtgagaatta 
gcaaattatc 
ggtaagagtc 
acggcatgct 
atagataaat 
aaagtgaatt 
actgctgaca 
gtcaatgcta 
gccccccgca 
agacttatga 


gaaattgttg 


tggatgagtt 
ccgttgtgtg 
ttaaggcagt 
agactgacct 
aaggagatga 
gttttgtcga 
tggctattga 
acttgtattt 
tgtattccgt 
aggctatgta 
cacagacttc 
gctatgacca 
gcaatgccce 
attattgcaa 
ttggtttata 
caacatgtga 
tcaagctttt 
gtattgccac 
gaaaacctag 
atagtaaagt 
tgtacagagg 
acactgtaat 
ctggcttgta 
aaaaggtcgg 
attttgccat 
ctcatgcagc 
gtagtagaat 
caacactaga 
ttgtagtctt 
gacttcgtgc 
cattgctgac 
aaacaatagg 


acactgtgag 


125 


ttacgcttac 
ctataacagt 
tctttattat 
tactaaagga 
ttacgtgtac 
tgatattgtc 
tgcttaccca 
acaatacatt 
aatgctaact 
cacaccacat 
acttcgttgc 
tgtcatttca 
aggttgtgat 
gtcacataag 
Caaaaacaca 
ttggactaat 
cgcagcagaa 
tgtacgcgaa 
accaccattg 
acagattgga 
tactacgaca 
gccacttagt 
cccaacactc 
catgcaaaag 
cggacttgct 
tgttgatgcc 
catacctgcg 
acagtatgtt 
tgatgaaatc 
aaaacactac 
taaaggcaca 
tccagacatg 


tgctttagtt 


gagtgtctct 
ctgcgtaaac 
aactatgcgg 
caaaataatg 
cctcacgaat 
ctgccttacc 
aaaacagatgq 
cttacaaaac 
agaaagttac 
aatgataaca 
acagtcttgc 
ggtgcctgta 
acatcacaca 
gtcactgatg 
ectcccatta 
tgtgtaggca 
gctggcgatt 
acgctcaaag 
gtactctctg 
aacagaaact 
gagtacacct 
tacaagttga 
gcacctactc 
aacatctcag 
tactctacac 
ctctattacc 
ctatgtgaaa 
cgtgcgcgcg 
ttctgcactg 
tctatggcta 
gtctatattg 
ctagaaccag 
ttccttggaa 


tatgacaata 


15300 
15360 
15420 
15480 
15540 
15600 
15660 
15720 
15780 
15840 


. 15900 


15960 
16020 
16080 
16140 
16200 
16260 
16320 
16380 
16440 
16500 
16560 
16620 
16680 
16740 
16800 
16860 
16920 
16980 
17040 
17100 
17160 
17220 
17280 


20 


25 


30 


35 


40 


45 


50 
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agctaaaagc 
ttacacatga 
ttacacgcaa 
ctgtagcttc 
aatatgacta 
gcttcaatgt 
atctttatga 
tacaagcaga 
atcctacaca 
gtgttgacat 
gtttcaaaat 
ctattcgtca 
atgctgtggg 
ctgtaccgac 
aacctccacc 
ggaatgtagt 
acagagtcgt 
tcaagattgg 
cttcatcaga 
catttatgat 
aacattgcca 
gtttagcagt 
taggagatga 
ctgcattgct 
agtgtgtgcc 
aagcttacaa 
atggtgtttg 
gtaggtttga 
tgtatgtgaa 
taaagcaatt 
tagtgtcgga 
taggtggtgc 
atatgatgat 


tgtggaatac 


acacaaggat 
tgtttcatct 
tcctgcttgg 
aaaaatctta 
tgtcatattc 
ggctatcaca 
caaactgcaa 
aaatgtaact 
ggcacctaca 
accaggcata 
gaattaccaa 
cgttcgtgcg 
tactaaccta 
tggttatgtt 
aggtgaccag 
gcgtattaag 
gttcgtcctt 
acctgaaaga 
tacttatgcc 
tgatgttcag 
ggtacatgga 
ccatgagtgc 
actgagggtt 
tgctgataag 
tcaggctgaa 
aatagaggaa 
tttgttttag 
cacaagagtc 
taagcatgca 
gcctttcttt 
tattgattat 
tgtttgcaga 
ttctgctgga 
atttaccagg 
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aagtcagctc 
gcaatcaaca 
agaaaagctg 
ggattgccta 
acacaaacta 
agggcaaaaa 


tttacaagtc 


ggacttttta 


cacctcagcg 
ccaaaggaca 
gtcaatggtt 
tggattggct 
cctctccagc 
gacactgaaa 
tttaaacatc 
atagtacaaa 
tgggcgcatg 
acgtgttgtc 
tgctggaatc 
cagtggggct 
aatgcacatg 
tttgttaage 
aattctgctt 
tttccagttc 
gtagaatgga 
ctcttctatt 
aattgtaacg 
ttgtcaaact 
ttccacactc 
tactattctg 
gttccactca 
caccatgcaa 
tttagcectat 


ttacagagtt 


aatgcttcaa 
gacctcaaat 
tttttatctc 
cgcagactgt 
ctgaaacagc 
ttggcatttt 
tagaaatacc 
aggactgtag 
ttgatataaa 
tgacctaccg 
accctaatat 
ttgatgtaga 
taggattttc 
ataacacaga 
ttataccact 
tgctcagtga 
gctttgagct 
tgtgtgacaa 
attctgtggg 
ttacgggtaa 
tggctagttg 
gcgttgattg 
gcagaaaagt 
ttcatgacat 
agttctacga 
cttatgctac 
ttgatcgtta 
tgaacttacc 
cagctttcga 
atagtccttg 
aatctgctac 
atgagtaccg 
ggatttacaa 


tagaaaatgt 


126 


aatgttctac 
aggcgttgta 
accttataat 
tgattcatca 
acactcttgt 
gtgcataatg 
acgtcgcaat 
taagatcatt 
gttcaagact 
tagactcatc 
gtttatcacc 
gggctgtcat 
tacaggtgtt 
attcaccaga 
catgtataaa 
tacactgaaa 
tacatcaatg 
acgtgcaact 
ttttgactat 
ccttcagagt 
tgatgctatc 
gtctgttgaa 
acaacacatg 
tggaaatcca 
tgctcagcca 
acatcacgat 
cccagccaat 
aggctgtgat 
taaaagtgca 
tgagtctcat 
gtgtattaca 
acagtacttg 
acaatttgat 


ggcttataat 


aaaggtgtta 
agagaatttc 
tcacagaacg 
cagggttctg 
aatgtcaacc 
tctgatagag 
gtggctacat 
actggtcttc 
gaaggattat 
tctatgatgg 
cgcgaagaag 
gcaactagag 
aacttagtag 
gttaatgcaa 
ggcttgccect 
ggattgtcag 
aagtactttg 
tgcttttcta 
gtctataacc 
aaccatgacc 
atgactagat 
taccctatta 
gttgtgaagt 
aaggctatca 
tgtagtgaca 
aaattcactg 
gcaattgtgt 
ggtggtagtt 
tttactaatt 
ggcaaacaag 
cgatgcaatt 
gatgcatata 
acttataacc 


gttgttaata 


17340 
17400 
17460 
17520 
17580 
17640 
17700 
17760 
17820 
17880 
17940 
18000 
18060 
18120 
18180 
18240 
18300 
18360 
18420 
18480 
18540 
18600 
18660 
18720 
18780 
18840 
18900 
18960 
19020 
19080 
19140 
19200 
19260 
19320 


20 


25 


30 


35 


40 


45 


50 
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aaggacactt 
acacaaaggt 
atgttgcatt 
tcaataattt 
ccccagcaca 
ctgagagtgc 
acctttttag 
caccttcaaa 
taaaaacaca 
cctactttac 
actttctcga 
tcgaacacat 
taggcttage 
acagcacagt 
gttctgtgat 
cagtgatttc 
ggtgtaagga 
aaccaggtgt 
accttcagaa 
agtatactca 
gagttattca 
gacaatggtt 
acgcagattc 
ttattattag 
aagaagggtt 
ctatagctgt 
atttctcatg 
taattggggc 
ctaactacat 
acatgagcaa 
aaatcaatga 
acagagttgt 
<210> 32 


<211> 297 
<212> DNA 


tgatggacac 
agatggtatt 
tgagctttgg 
gggtgttgat 
tgtatctaca 
ttgttcttca 
aaacgcccgt 
gggaccagca 
gtttaactac 
tcagagcaga 
gctcgctatg 
cgtttatgga 
caagcgctca 
gaaaaattac 
tgatctttta 
aaaagtggtc 
tggacatgtt 
tgcgatgcct 
ttatggtgaa 
actgtgtcaa 
ctttggtgct 
gccaactggc 
tactttaatt 
cgatatgtat 
tttcacttat 
aaagataaca 
gtggacagct 
taactatctt 
tttctggagg 
atttcctctt 
tatgatttat 


ggtttcaagt 


<213> CORONAVIRUS 


EP 1 694 829 B1 


gccggcgaag 
gatgtggaga 
gctaagcgta 
atcgctgcta 
ataggtgtct 
cttactgtct 
aatggtgttt 
caagctagcg 
tttaagaaag 
gacttagagg 
gatgaattca 
gatttcagtc 
caagattcac 
ttcataacag 
cttgatgact 
aaggttacaa 
gaaaccttct 
aacttgtaca 
aatgctgtta 
tacttaaata 
ggctctgata 
acactacttg 
ggagactgtg 
gaccctagga 
ctgtgtggat 
gagcattctt 
tttgttacaa 
ggcaagccga 
aacacaaatc 
aaattaagag 
tctcttctgg 
gatattcttg 


cacctgtttc 
tctttgaaaa 
acattaaacc 
atactgtaat 
gcacaatgac 
tgtttgatgg 
taataacaga 
tcaatggagt 
tagacggcat 
attttaagcc 
tacagcgata 
atggacaact 
cacttaaatt 
atgcgcaaac 
ttgtcgagat 
ttgactatgc 
acccaaaact 
agatgcaaag 
taccaaaagg 
cacttacttt 
aaggagttgc 
tcgattcaga 
caacagtaca 
ccaaacatgt 
ttataaagca 
ggaatgctga 
atgtaaatgc 
aggaacaaat 
ctatccagtt 
gaactgctgt 
aaaaaggtag 


ttaacaacta 


127 


catcattaat 
taagacaaca 
agtgccagag 
ctgggactac 
tgacattgcc 
tagagtggaa 
aggttcagtc 
cacattaatt 
tattcaacag 
cagatcacaa 
taagctcgag 
tggcggtctt 
agaggatttt 
aggttcatca 
aataaagtca 
tgaaatttca 
acaagcaagt 
aatgcttctt 
aataatgatg 
agctgtaccc 
accaggtaca 
tcttaatgac 
tacggctaat 
gacaaaagag 
aaaactagcc 
cctttacaag 
atcatcatcg 
tgatggctat 
gtcttcctat 
aatgtctctt 
gcttatcatt 


a 


aatgctgttt 
cttcctgtta 
attaagatac 
aaaagagaag 
aagaaaccta 
ggacaggtag 
aaaggtctaa 
ggagaatcag 
ttgcctgaaa 
atggaaactg 
ggctatgcct 
catttaatga 
atccctatgg 
aaatgtgtgt 
caagatttgt 
ttcatgcettt 
caagcgtggc 
gaaaagtgtg 
aatgtcgcaa 
tacaacatga 
gctgtgctca 
ttcgtctecg 
aaatgggacc 
aatgactcta 
ctgggtggtt 
cttatgggcc 
gaagcatttt 
accatgcatg 
tcactctttg 
aaggagaatc 


agagadaaca 


19380 
19440 
19500 
19560 
19620 
19680 
19740 
19800 
19860 
19920 
19980 
20040 
20100 
20160 
20220 
20280 
20340 
20400 
20460 
20520 
20580 
20640 
20700 
20760 
20820 
20880 
20940 
21000 
21060 
21120 
21180 
21221 


20 


25 


30 


35 


40 


45 


50 


55 


<400> 32 
atggacccca 
caactgacaa 
aaggtttacc 


aacttagatt 


aaattggcta 


<210> 33 
<211> 98 
<212> PRT 


EP 1 694 829 B1 


atcaaaccaa cgtagtgccc 


taaccagaat ggaggacgca 


cccgcattac atttggtgga cccacagatt 


atggggcaag gccaaaacag cgccgacccc 


caataatact gcgtcttggt tcacagctct cactcagcat ggcaaggagg 


ccctcgaggc cagggcgttc caatcaacac caatagtggt ccagatgacc 


ctaccgaaga gctacccgac gagttcgtgg tggtgacggc aaaatga 


<213> CORONAVIRUS 


<400> 33 


Met Asp Pro 
1 
Asp Pro Gln 


Gin Gly GIn 
35 


Asn Gin Thr Asn Val val 


Tle Gln Leu Thr Ile Thr 
20 25 


Asn Ser Ala Asp a Lys 
4 


Leu Gly Ser Gin Leu Ser Leu Ser Met 


50 


55 


Leu Glu Ala Arg Ala Phe Gin Ser Thr 


65 


70 


Lys Leu Ala Thr Thr Glu Glu Leu Pro 


Ala Lys 


<210> 34 
<211> 213 
<212> DNA 


85 


<213> CORONAVIRUS 


<400> 34 


Pro 


10 


Arg 


val 


Ala 


Pro 


Asp 
90 


Pro 


Met 


Tyr 


Arg 


Tle 


75 


Glu 


Ala 


Glu 


Pro 


Arg 


60 


val 


Phe 


Leu 


Asp 


Ile 


45 


Asn 


val 


val 


His Leu Val 
15 


Ala Met Gly 
30 


Ile Leu Arg 


Leu Asp Ser 


GIn Met Thr 
80 


Val val Thr 
95 


atgctgccac cgtgctacaa cttcctcaag gaacaacatt gccaaaaggce ttctacgcag 


agggaagcag aggcggcagt caagcctctt ctcgctcctc atcacgtagt cgcggtaatt 


Caagaaattc aactcctggc agcagtaggg gaaattctcc tgctcgaatg gctagcggag 


gtggtgaaac t 


gccctcgcg ctattgctgc tag 


128 


60 
120 
180 
240 
297 


60 
120 
180 
213 


20 


25 


30 


35 


45 


50 


55 


<210> 35 

<211> 70 

<212> PRT 

<213> CORONAVIRUS 


<400> 35 


Met Leu Pro Pro Cys 
1 5 
Ala ser Thr Gin Arg 
20 
Pro His His Val Val 
35 
val Gly Glu Ile Leu 
50 


ae Ser Arg Tyr Cys 


<210> 36 

<211> 1377 

<212> DNA 

<213> CORONAVIRUS 


<220> 
<221> CDS 

<222> (67)..(1335) 
<223> 


<400> 36 


atgaaggtca ccaaactgct gcatttagag acgtacttgt tgttttaaat aaacgaacaa 


EP 1 694 829 B1 


Tyr Asn Phe Leu Lys Glu Gin His Cys Gln Lys 
10 15 
Glu Ala Glu Ala Ala Val Lys Pro Leu Leu Ala 
25 30 
Ala Val Ile Gin Glu Ile Gin Leu Leu Ala Ala 
Leu — Glu Trp Leu Ala oe val Val Lys Leu 


cys 


attaaa atg tct gat aat gga ccc caa tca aac caa cgt agt gcc ccc 


129 


60 
108 


20 


25 


30 


35 


40 


45 


50 


55 


cgc 
Arg 
15 


gga 
Gly 


ccc 
Pro 


gag 
Glu 


agt 


ser 


gtt 
Val 
95 

ttc 
Phe 


aac 
Asn 


ccc 
Pro 


gtg 


gag 
Glu 
175 
agt 
ser 


tct 
ser 


ttg 
Leu 


aly 


gca 
255 
gtc 


att 
Ile 


ély 


aat 
Asn 


gaa 
Glu 


ggt 
ety 
80 

cgt 
Arg 


tat 
Tyr 


aaa 
Lys 


aaa 
Lys 


cta- 


Leu 
160 


gga 
Gly 


coc 
Arg 


cect 
Pro 


ctg 
Leu 


caa 
Gin 
240 


tct 
ser 


act 


EP 1 694 829 B1 


Met Ser ASp ASn aly Pro Gin Ser Asn Gln Arg Ser Ala Pro 
1 10 


aca 
Thr 


cgc 
Arg 


aat 
Asn 


ctt 
Leu 
65 

cca 
Pro 


ggt 
Gly 


tac 
Tyr 


gaa 
Glu 
gac 
145 
caa 
Gin 


age 
ser 


aN 


gct 
Ala 


cta 
Leu 
225 


caa 
Gln 


aaa 
Lys 


Ccaa 


ttt 
Phe 


aat 
Asn 


act 
Thr 
50 


aga 
Arg 


gat 
ASp 


got 
Gly 


cta 
Leu 


ggc 
ely 
130 
cac 
His 


ctt 
Leu 


aga 
Arg 


aat 
Asn 


cga 
Arg 
210 


gac 
Asp 


caa 
Gln 


aag 
Lys 


gca 


ety 


ety 
35 


gcg 
Ala 


ttc 
Phe 


gac 
Asp 


gac 
Asp 


a 
115 


atc 
Tle 


att 
Ile 


cct 
Pro 


Gly 


tca 
ser 
195 


atg 
Met 


aga 
Arg 


caa 
Gin 


cct 
Pro 


ttt 


gga 
Gly 
20 

gca 
Ala 


tct 
ser 


cect 
Pro 


caa 
Gin 


ggc 
Gly 
100 
act 
Thr 


gta 
val 


ety 


caa 
Glin 


ggc 
Gly 
180 
aga 
Arg 


gct 
Ala 


ttg 
Leu 


Gly 


cgc 
Arg 
260 


ggg 


ccc 
Pro 


agg 
Arg 


tgg 
Trp 


cga 
Arg 


att 
Tle 
85 


daa 
Lys 


tgg 
Trp 


acc 
Thr 


gga 
ety 
165 
agt 
ser 


aat 
Asn 


age 
ser 


aac 
Asn 


caa 
245 
caa 
Gln 


aga 


aca 
Thr 


cca 
Pro 


ttc 
Phe 


aly 
70 


cty 


atg 
Met 


cca 
Pro 


gtt 
Val 


cgc 
Arg 
150 


aca 
Thr 


caa 
Gin 


tca 
ser 


aty 


cag 
Gin 
230 


act 
Thr 


aaa 
Lys 


cgt 


gat tca act gac 


Asp 


aaa 
Lys 


aca 
Thr 
55 


cag 
Gin 


tac 
Tyr 


aaa 
Lys 


gaa 
Glu 


gca 
Ala 
135 


aat 
Asn 


aca 
Thr 


gcc 
Ala 


act 
Thr 


ggt 
ely 
215 
ctt 
Leu 


gtc 
Val 


cgt 
Arg 


ggt 


ser 


cag 
Gin 
40 


gct 
Ala 


Gly 


tac 
Tyr 


gag 
Glu 


gct 
Ala 
120 


act 
Thr 


cect 
Pro 


ttg 
Leu 


tct 
ser 


cect 
Pro 
200 


aty 


gag 
Glu 


act 
Thr 


act 
Thr 


cca 


130 


Thr 
25 


cgc 
Arg 


ctc 
Leu 


gtt 
val 


cga 
Arg 


ctc 
Leu 
105 


tca 
ser 


gag 
Glu 


aat 
Asn 


cca 
Pro 


tct 
ser 
185 


aly 


gaa 
Glu 


agc 
ser 


aag 
Lys 


gcc 
Ala 
265 


gaa 


Asp 


cga 
Arg 


act 
Thr 


cca 
Pro 


aga 
Arg 
90 


age 
ser 


ctt 
Leu 


aly 


aac 
Asn 


aaa 
Lys 
170 


cgc 
Arg 


agc 
ser 


act 
Thr 


aaa 
Lys 


aaa 
Lys 
250 


aca 
Thr 


Caa 


aat 
Asn 


ccc 
Pro 


cag 
Gln 


atc 
Ile 
75 


gct 
Ala 


ccc 
Pro 


ccc 
Pro 


gcc 
Ala 


aat 
Asn 
155 


a 


tcc 
ser 


agt 
ser 


gcc 
Ala 


gtt 
val 
235 


tct 
ser 


ada 
Lys 


acc 


aac 
Asn 


caa 
Gin 


cat 
H1S 
60 


aac 
Asn 


acc 
Thr 


aga 
Arg 


tac 
Tyr 


ttg 
Leu 
140 


gct 
Ala 


ttc 
Phe 


tca 
ser 


cag 
Gin 


ety 
45 
a 


acc 
Thr 


cga 
Arg 


tgg 
Trp 


gg 
125 


aat 
Asn 


gcc 
Ala 


tac 
Tyr 


tca 
ser 


agg gga 


Arg 


ctc 
Leu 
220 


tect 
ser 


gct 
Ala 


cag 
Gin 


Ccaa 


Gly 
205 
gcg 
Ala 


ggt 
Gly 


gct g 


Ala 


tac 
Tyr 


gga 


aat 
Asn 
30 


tta 
Leu 


aag 
Lys 


aat 
Asn 


cga 
Arg 


tac 
Tyr 
110 


gct 
Ala 


aca 
Thr 


acc 
Thr 


gca 
Ala 


cgt 
Arg 
190 


aat 
Asn 


cta 
Leu 


aaa 
Lys 


Glu 


aac 
Asn 
270 


aat 


156 


204 


252 


300 


348 


396 


444 


492 


540 


588 


636 


684 


732 


780 


828 


876 


924 


20 


25 


30 


35 


40 


45 


50 


55 


val Thr Gln Ala Phe Gly Arg 
275 


ttc 999 gac caa gac cta atc 
Phe Gly Asp on Asp Leu Ile 


ccg caa att gca caa ttt gct 
Pro Glin ae Ala Gln Phe Ala 


tca cgc att ggc atg gaa gtc 
Ser Arg Ile Gly Met Glu Val 
320 325 


cat gga gcc att aaa ttg gat 
His Gly Ala Ile Lys Leu Asp 
335 340 


gtc ata ctg ctg aac aag cac 
Val Ile Leu Leu Asn Lys His 
355 


aca gag cct aaa aag gac aaa 
Thr Glu Pro Lys Lys Asp Lys 
370 
ttg ccg cag aga Caa aag aag 
Leu Pro Gln Arg Gln Lys Lys 
385 

gct gac atg gat gat ttc tcc 

Ala ASp Met Asp Asp Phe Ser 
400 405 

gct tct gct gat tca act cag 

Ala Ser Ala Asp Ser Thr Glin 

415 420 


aggcagatgg gctatgtaaa cg 


<210> 37 

<211> 422 

<212> PRT 

<213> CORONAVIRUS 


<400> 37 


ace ser Asp Asn oy Pro Gln 
Thr Phe Gly Shr Pro Thr Asp 
Arg Asn oly Ala Arg Pro Lys 


Asn Thr Ala Ser Trp Phe Thr 
50 55 


EP 1 694 829 B1 


Arg Gly Pro Glu 
280 


aga 
Arg 


cca 
Pro 
310 
aca 
Thr 


gac 
Asp 


att 
Ile 


aag 
Lys 


cag 
Gin 
390 


aga 
Arg 


gca 
Ala 


ser 


ser 


Gln 


40 


Ala 


caa 
Gln 
295 


agt 
ser 


cct 
Pro 


aaa 
Lys 


gac 
Asp 


aaa 


Lys. 


375 
ccc 
Pro 


caa 
Gin 


taa 


Asn 


Thr 


25 


Arg 


Leu 


ety 


gcc 
Ala 


tcg 
ser 


gat 
Asp 


gca 
Ala 
360 


aag 
Lys 


act 
Thr 


ctt 
Leu 


act 
Thr 


tct 
ser 


aly 


cca 
Pro 
345 


tac 
Tyr 


act 
Thr 


gt 
Va 


caa 
Gin 


Gln 


gat 
Asp 


gca 
Ala 


aca 
Thr 
330 


caa 
Gln 


aaa 
Lys 


gat 
Asp 


act 
Thr 


aat 
Asn 
410 


Thr 


tac 
Tyr 


ttc 
Phe 
315 


tgg 
Trp 


ttc 
Phe 


aca 
Thr 


gaa 
Glu 


ctt 
Leu 
395 


tec 
ser 


Gin 


aaa 
Lys 
300 


ttt 
Phe 


ctg 
Leu 


aaa 
Lys 


ttc 
Phe 


gct 
Ala 
380 


ctt 
Leu 


atg 
Met 


Gly 
285 


cat 
H1s 


aly 


act 
Thr 


gac 
Asp 


cca 
Pro 
365 


cag 
Gin 


ect 
Pro 


agt 
Ser 


acactcatga tgaccacaca 


Gin Arg Ser Ala Pro Arg 
10 15 


Asp Asn Asn Gin Asn Gly 
30 


Arg Pro Gin cy Leu Pro 
4 


Thr Gin His Gly Lys Glu 
60 


131 


Asn 


tgg 
Trp 


atg 
Met 


tat 
Tyr 


aac 
Asn 
350 


cca 
Pro 


cct 
Pro 


gcg 
Ala 


aly 


Tle 
Gly 
Asn 


Glu 


972 


1020 


1068 


1116 


1164 


1212 


1260 


1308 


1355 


1377 


20 


25 


30 


35 


40 


45 


50 


55 


Leu 
65 
Pro 


Gly 


Tyr 


ser 


Gly 


Leu 
225 


Gin 


Lys 


ASp 


Tle 
305 


Tle 


Arg 


Asp 


Gly 


Leu 


Leu 


Arg 


Asn 


Arg 


210 


Asp 


Gln 


Lys 


Ala 


Gln 


290 


Ala 


Gly 


Phe 


Asp 


Asp 


Gly 


Ile 


Ile 


Pro 


Gly 


ser 


195 


Met 


Arg 


Gln 


Pro 


Phe 


275 


Asp 


Gin 


Met 


Pro 


GIn 


Gly 


100 


Thr 


Val 


Gly 


Gin 


Gly 


Arg 


Ala 


Leu 


Gly 


Arg 


260 


Gly 


Leu 


Phe 


Glu 


Arg 


Tle 


85 


Lys 


Gly 


Trp 


Thr 


Gly 


ser 


Asn 


ser 


Asn 


Gln 


245 


Gin 


Arg 


Ile 


Ala 


Val 
325 


Gly 


70 


Gly 


Met 


Pro 


val 


Arg 


150 


Thr 


Gin 


ser 


Gly 


Gln 


230 


Thr 


Lys 


Arg 


Arg 


Pro 


310 


Thr 
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Gln 


Tyr 


Lys 


Glu 


Ala 


135 


Asn 


Thr 


Ala 


Thr 


Gly 


Leu 


Val 


Arg 


Gly 


Gln 


295 


Ser 


Pro 


Gly Val Pro 


Tyr 


Glu 


Ala 


120 


Thr 


Pro 


Leu 


ser 


Pro 


200 


Gly 


Glu 


Thr 


Thr 


Pro 


280 


Gly 


Ala 


ser 


Arg 


Leu 


105 


ser 


Glu 


Asn 


Pro 


ser 


185 


Gly 


Glu 


ser 


Lys 


Ala 


265 


Glu 


Thr 


ser 


Gly 


132 


Arg 


90 


ser 


Leu 


Gly 


Asn 


Lys 


Arg 


ser 


Thr 


Lys 


Lys 


Thr 


Gln 


Asp 


Ala 


Thr 
330 


Tle 


75 


Ala 


Pro 


Pro 


Ala 


Asn 


155 


Gly 


Ser 


ser 


Ala 


Val 


235 


ser 


Lys 


Thr 


Tyr 


Phe 


315 


Trp 


Asn 


Thr 


Arg 


Tyr 


Leu 


140 


Ala 


Phe 


ser 


Arg 


Leu 


220 


ser 


Ala 


Gin 


GIn 


Lys 


300 


Phe 


Leu 


Thr 
Arg 
Trp 
Gly 
Asn 
Ala 
Tyr 
Ser 
Gly 
Ala 
Gly 
Ala 
Tyr 
Gly 
His 
Gly 


Thr 


Asn 


Arg 


Tyr 


110 


Ala 


Thr 


Thr 


Ala 


Arg 


190 


Asn 


Leu 


Lys 


Glu 


Asn 


270 


Asn 


Trp 


Met 


Tyr 


ser 


val 


95 


Phe 


Asn 


Pro 


Val 


Glu 


175 


ser 


ser 


Leu 


Gly 


Ala 


255 


val 


Phe 


Pro 


ser 


His 
335 


Gly 


80 


Arg 


Tyr 


Lys 


Lys 


Leu 


160 


Gly 


Arg 


Pro 


Leu 


GIn 


240 


ser 


Thr 


Gly 


Gln 


Arg 


320 


Gly 


20 


25 


30 


35 


40 


45 


50 


55 


Ala Ile 


Leu Leu 
Pro 


Lys 


Gln 
385 


Arg 


Met ASp 


Ala Asp 


<210> 38 
<211> 1377 
<212> DNA 


Leu 
340 


Lys 


Asn 
355 


Lys 
Lys Asp 
Gln Lys 


Asp Phe 


Asp 


His 


Lys 


Lys 


ser 


EP 1 694 829 B1 


Ile 


Lys 


Gin 


390 


Arg 


405 


Thr 
420 


ser 


<213> CORONAVIRUS 


<400> 38 


atgaaggtca 
attaaaatgt 
ggtggaccca 
aaacagcgcc 
cagcatggca 
agtggtccag 
gacggcaaaa 
gaagcttcac 
gccttgaata 
gtgctacaac 
ggcggcagtc 
actcctggca 
gccctcgcge 
ggccaacaac 
cctcgccaaa 


ggtccagaac 


ccaaactgct 
ctgataatgg 
cagattcaac 
gaccccaagg 
aggaggaact 
atgaccaaat 
tgaaagagct 
ttccctacgg 
cacccaaaga 
ttcctcaagg 
aagcctcttc 
gcagtagggg 
tattgctgct 
aacaaggcca 
aacgtactgc 


aaacccaagg 


Glin 


Ala 


gcatttagag 
accccaatca 
tgacaataac 
tttacccaat 
tagattccct 
tggctactac 
cagccccaga 
cgctaacaaa 
ccacattggc 
aacaacattg 
tcgctcctca 
aaattctcct 
agacagattg 
aactgtcact 
cacaaaacag 


aaatttcggg 


Asp Lys Asp Pro Gln 
345 
Asp Ala Tyr Lys 
360 
Lys Lys Thr Asp 
375 
Pro Thr val Thr 


Gln Leu Gin Asn 


410 


acgtacttgt 
aaccaacgta 
cagaatggag 
aatactgcgt 
cgaggccagg 
cgaagagcta 
tggtacttct 
gaaggcatcg 
acccgcaatc 
ccaaaaggct 
tcacgtagtc 
gctcgaatgg 
aaccagcttg 
aagaaatctg 
tacaacgtca 


gaccaagacc 


133 


Phe Lys Asp 


Pro 
365 


Thr Phe 


Glu Ala Gln 
380 


Leu Leu Pro 


395 


ser Met Ser 


tgttttaaat 
gtgccccccg 
gacgcaatgg 
cttggttcac 
gcgttccaat 
cccgacgagt 
attacctagg 
tatgggttgc 
ctaataacaa 
tctacgcaga 
gcggtaattc 
ctagcggagg 
agagcaaagt 
ctgctgaggc 
ctcaagcatt 


taatcagaca 


Asn Val 


350 


Pro Thr 


Leu P 


Pro 


Ala Ala A 


Ile 


Glu 


ro 


Sp 


400 


Ala § 
415 


Gly 


aaacgaacaa 
cattacattt 
ggcaaggcca 
agctctcact 
caacaccaat 
tcgtggtggt 
aactggccca 
aactgaggga 
tgctgccacc 
gggaagcaga 
aagaaattca 
tggtgaaact 
ttctggtaaa 
atctaaaaag 
tgggagacgt 
aggaactgat 


er 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 


20 


25 


30 


35 


40 


45 


50 


55 


tacaaacatt 
tcacgcattg 
aaattggatg 
gacgcataca 
gaagctcagc 
gctgacatgg 


tcaactcagg 


<210> 39 
<211> 204 
<212> DNA 


ggccgcaaat 
gcatggaagt 
acaaagatcc 
aaacattccc 
ctttgccgca 
atgatttctc 


cataaacact 


<213> CORONAVIRUS 


<400> 39 


atattaggtt 
ctctaaacga 


gcagtataaa 


tttacctacc 
actttaaaat 


Caataataaa 


tctgcagact gcttacggtt 


<210> 40 
<211> 809 
<212> DNA 


<213> CORONAVIRUS 


<400> 40 


actcaagcat 
ctaatcagac 
gcctctgcat 
ctgacttatc 
atactgctga 
gaCcaaaaaga 
actgtgactc 
atgagtggag 
agatgggcta 
gaatgaattc 
aatctttaat 


ttgggagacg 
aaggaactga 
tctttggaat 
atggagccat 
acaagcacat 
aaaagactga 
ttcttcctgc 
cttctgctga 
tgtaaacgtt 
tcgtaactaa 


caatgtgtaa 
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tgcacaattt 
cacaccttcg 
acaattcaaa 
accaacagag 
gagacaaaag 
cagacaactt 


catgatgacc 


gctccaagtg 
ggaacatggc 
gacaacgtca 
cctaaaaagg 
aagcagccca 
Caaaattcca 


acacaaggca 


cctctgcatt 
tgacttatca 
tactgctgaa 
acaaaaagaa 
ctgtgactct 
tgagtggagc 
gatgggctat 


ctttggaatg 
tggagccatt 
caagcacatt 
aaagactgat 
tcttcctgcg 
ttctgctgat 


gtaaacg 


Caggaaaagc Caaccaacct cgatctcttg tagatctgtt 


ctgtgtagct gtcgctcggc tgcatgccta gtgcacctac 


ttttactgtc gttgacaaga aacgagtaac tcgtccctct 


tcgt 


tggtccagaa 
ttacaaacat 
gtcacgcatt 
taaattggat 
tgacgcatac 
tgaagctcag 
ggctgacatg 
ttcaactcag 
ttcgcaattc 
acagcacaag 


cattagggag 


caaacccaag 
tggccgcaaa 
ggcatggaag 
gacaaagatc 
aaaacattcc 
cctttgccgce 
gatgatttct 
gcataaacac 
cgtttacgat 
taggtttagt 
gacttgaaag 
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gaaatttcgg 
ttgcacaatt 
tcacaccttc 
cacaattcaa 
caccaacaga 
agagacaaaa 
ccagacaact 
tcatgatgac 
acatagtcta 
taactttaat 


agccaccaca 


ggaccaagac 
tgctccaagt 
gggaacatgg 
agacaacgtc 
gcctaaaaag 
gaagcagccc 
tcaaaattcc 
cacacaaggc 
ctcttgtgca 
ctcacatagc 


ttttcatcga 


1020 
1080 
1140 
1200 
1260 
1320 
1377 


60 
120 
180 
204 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 


20 


25 


30 


35 


40 


45 


50 


55 


ggccacgcgg agtacgatcg agggtacagt gaataatgct agggagagct gcctatatgg 
aagagcccta atgtgtaaaa ttaattttag tagtgctatc cccatgtgat tttaatagct 
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tcttaggaga atgacaaaaa aaaaaaadaa 


<210> 41 
<211> 448 
<212> DNA 


<213> CORONAVIRUS 


<400> 41 


aatgaacaca 
acaagtgcca 
gaagccacgc 
tttctcgttg 
acctaggtat 
gggacgagtt 
ggtgcactag 


agatctacaa 


<210> 42 
<211> 2033 
<212> DNA 


tagggctgtt 
tttttgaggt 
actagcacgt 
acaccaagaa 
gctgatgatc 
actcgtttct 
gcatgcagcc 


gagatcgagg 


<213> CORONAVIRUS 


<400> 42 


atacctaggt 
caacgagaaa 
gcgtggcttc 
tggcacttgt 
tgtgttcatt 
ggttgcagaa 
gccacatgtg 
taagggagcc 
gcttggcact 
tgcactccgt 
caatttctgt 


ttcgtccggg 
acacacgtcc 
ggggactctg 
ggtctagtag 
aaacgttctg 
atggacggca 
ggcgaaaccc 
ggtggtcata 
gatcccattg 
gaactcactc 


ggcccagatg 


caagctgggg 
gttcacgtgc 
ctctaacctg 
caaggctctc 
gactgcaaca 
tgtcaacgac 
gagcgacagc 


ttggttgg 


tgtgaccgaa 
aactcagttt 
tggaagaggc 
agctggaaaa 
atgccttaag 
ttcagtacgg 
caattgcata 
gctatggcat 
aagattatga 
gtgagctcaa 
ggtaccctct 


cagtacgcct 
ctccgatagg 
aaggacaggc 
catcttacct 
cggacgaaac 
agtaaaattt 


tacacagatt 


aggtaagatg 
gcctgtcctt 
cctatcggag 
aggcgtactg 
caccaatcac 
tcgtagcggt 
ccgcaatgtt 
cgatctaaag 
acaaaactgg 
tggaggtgca 
tgattgcatc 
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ttttccagct 
gcctcttcca 
aaactgagtt 
ttcggtcaca 
cgtaagcagt 
attattgttt 


ttaaagttcg 


gagagccttg 
caggttagag 
gcacgtgaac 
ccccagcttg 
ggccacaagg 
ataacactgg 
cttcttcgta 
tcttatgact 
aacactaagc 
gtcactcgct 


aaagattttc 


ctactagacc 
cagagtcccc 
ggacgtgtgt 
cccggacgaa 
ctgcagaaga 
atactgcgta 


tttagagaac 


ttcttggtgt 
acgtgctagt 
acctcaaaaa 
aacagcccta 
tcgttgagct 
gagtactcgt 
agaacggtaa 
taggtgacga 
atggcagtgg 
atgtcgacaa 


tcgcacgcgc 


720 
780 
809 


60 
120 
180 
240 
300 
360 
420 
448 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 


20 


25 


30 


35 


40 


45 


50 


55 


gggcaagtca 
ctactgctgc 
ctacgagcac 
ggaatgccca 
tgaaaagaaa 
tccacaggag 
agtttcatgg 
tttagttatt 
gccatgtcct 
caaccactca 
ctgtgtgttt 
tgctgatatt 
ggatctcctt 
tttgaatgaa 
tgacactata 
ctataaagtt 
agttttaaca 
tgcgcgcaca 
catacttgat 
agacctgctc 
gacttctcag 
tgaatggatt 
tctcaaattt 


<210> 43 
<211> 2018 
<212> DNA 


atgtgcactc 
cgtgaccatg 
cagacaccct 
aagtttgtgt 
aagactgagg 
tgtaacaata 
cagacgtgcg 
gaaggaccta 
gcctgtcaag 
aacattgaaa 
gcctatgttg 
ggctcaggcc 
gagatactga 
gaggttgcca 
aagagtcttg 
accaagggaa 
ccactgtgtg 
cttgatgcag 
ggtatttctg 
accaacagtg 
tggttgtcta 
gaggcgaaac 


ctcattacag 


<213> CORONAVIRUS 


<400> 


ggattgaggc gaaacttagt 


aatttctcat tacaggtgtt 


acatcaagga ttgtgtaaaa 


ttgatcaagt cactatcgct 


tcgctcaaag caagggactt 
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tttccgaaca 
agcatgaaat 
tcgaaattaa 
ttcctcttaa 
gtttcatggg 
tgcacttgtc 
actttctgaa 
ctacatgtgg 
acccagagat 
ctcgactccg 
gctgctataa 
atactggcat 
gtcgtgaacg 
tcattttggc 
attacaagtc 
agcccgtaaa 
gttttccctc 
caaaccactc 
aacagtcatt 
tcattattat 
atcttttggg 
ttagtgcagg 
gtgtttttga 


gcaggagttg 
tttgacatcg 
tgcttcattg 
ggcgcaaagt 
taccgtcagt 


acttgattac 
tgcctggttc 
gagtgccaag 
ctcaaaagtc 
gcgtatacgc 
taccttgatg 
agccacttgt 
gtacctacct 
tggacctgag 
Caagggaggt 
taagcgtgcc 
tactggtgac 
tgttaacatt 
atctttctct 
tttcaaaacc 
aggtgcttgg 
acaggctgct 
aattcctgat 
acgtcttgtc 
ggcatatgta 
cactactgtt 
agttgaattt 


catcgtcaag 


aatttctcaa 
tcaagggtca 
atgttgttaa 
tgcgatcact 


gtatacgtgg 
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atcgagtcga 
actgagcgct 
aaatttgaca 
aaagtcattc 
tctgtgtacc 
aaatgtaatc 
gaacattgtg 
actaatgctg 
catagtgttg 
aggactagat 
tactgggttc 
aatgtggaga 
aacattgttg 
gcttctacaa 
attgttgagt 
aacattggac 
ggtgttatca 
ttgcaaagag 
gacgccatgg 
actggtggtc 
gaaaaactca 
ctcaaggatg 


ggtcaaatac 


ggatgcttgg 
aatacaggtt 
caaggcactc 
caacttaggt 


caaggagcag 


agagaggtgt 
ctgataagag 
ctttcaaagg 
aaccacgtgt 
ctgttgcatc 
attgcgatga 
gcactgaaaa 
tagtgaaaat 
cagattatca 
gttttggagg 
ctcgtgctag 
ccttgaatga 
gegattttca 
gtgectttat 
cctgcggtaa 
aacagagatc 
gatcaatttt 
cagctgtcac 
tttatacttc 
ttgtacaaca 
ggcctatctt 
cttgggagat 


agg 


gagattctca 
gcttcagata 
gaaatgtgca 
gaagtcttca 


ctgcaactac 


720 
780 
840 
900 
960 

1020 

1080 

1140 

1200 

1260 

1320 

1380 

1440 

1500 

1560 

1620 

1680 

1740 

1800 

1860 

1920 

1980 

2033 


60 
120 
180 
240 
300 


20 


25 


30 


35 


40 


45 


50 


55 


tcatgcctct 
tacttacctec 
ttgatagctt 
tcttagagat 
acaatgtctt 
ctgtttggga 
ttgacaaagt 
ctgagtttgc 
tecttaccaa 
atgatgctgg 
aggaagaaga 
agtacggtac 
cagttcgagt 
agattgagcc 
taaaacttac 
ctaatcctat 
caggtgcact 


agctaaatgg 


agaagtgtct 


aggcagcata 
gcatatttag 
aggtttatat 
ataacctgaa 
ccaaaactga 
cctgcattga 
tcttgtttge 
aagatatgtc 
gtgatatcac 


caagagcttt 


<210> 44 
<211> 1442 
<212> DNA 


taaggcacca 
tgaggaggtt 
Cacaaatgga 
taaggacaaa 
tcgcttaaaa 
agttcaaggt 
gcttaatgaa 
atgtgttgta 
catgggtatt 
tgaagaaaac 
ggacgatgca 
agaggatgat 
tgaggaagaa 
agaaccagaa 
tgacaatgtt 
ggtgattgta 
Caacaaggca 
ccctcttaca 
gcatgttgtt 
tgaaaatttc 
tgctaaacca 
tgcagtcaat 
gcctagagtg 
ggagaaatct 
tgaggttacc 
tgatatcaat 
tttccttgag 
ttgtgttgta 
gaagaaagtg 


<213> CORONAVIRUS 


<400> 44 
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aaagaagtaa 
gttctcaaga 
gctatcgttg 
gaacaatact 
gggggtgcac 
tacaagaatg 
aagtgctctg 
gcagaggctg 
gatcttgatg 
ttttcatcac 
gagtgtgagg 
tatcaaggtc 
gaagaggaag 
cctacacctg 
gccattaaat 
aatgctgcta 
accaatggtg 
gtaggagggt 
ggacctaacc 
aattcacagg 
cttcagtctt 
gacaaagctc 
gaagcaccta 
gtcgtacaga 
acaacactgg 
ggtaagcttt 
aaggatgcac 
ataccctcca 


ccagttgatg 


cctttcttga 
acggtgaact 
gcacaccagt 
gcgcattgtc 
Caattaaagg 
tgagaatcac 
tctacactgt 
ttgtgaagac 
agtggagtgt 
gtatgtattg 
aagaagaaat 
tcectctgga 
actggctgga 
aagaaccagt 
gtgttgacat 
acatacacct 
ccatgcaaaa 
cttgtttgct 
taaatgcagg 
acatcttact 
tacaagtgtg 
tttatgagca 
aacaagagga 
agcctgtcga 
aagaaactaa 
accatgattc 
cttacatggt 
aaaaggctagg 


agtatata 
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aggtgattca 
Ccgaagcactc 
ctgtgtaaat 
tcctggttta 
tgtaaccttt 
atttgagctt 
tgaatccggt 
tttacaacca 
agctacattc 
ttccttttac 
tgatgaaacc 
atttggtgcc 
tgatactact 
taatcagttt 
cgttaaggag 
gaaacatggt 
ggagagtgat 
ttctggacat 
tgaggacatc 
tgcaccattg 
cgtgcagacg 
ggttgtcatg 
gccaccaaac 
tgtgaagcca 
gtttcttacc 
tcagaacatg 
aggtgatgtt 


tggcactact 


catgacacag 
gagacgcccg 
ggcctcatge 
ctggctacaa 
ggagaagata 
gatgaacgtg 
accgaagtta 
gtttctgatc 
tacttatttg 
cctccagatg 
tgtgaacatg 
tcagctgaaa 
gagcaatcag 
actggttatt 


gcacaaagtg 


ggtggtgtag 


gattacatta | 


aatcttgcta 
cagcttctta 
ttgtcagcag 
gttcgtacac 
gattatcttg 
acagaagatt 
aaaattaagg 
aataagttac 
cttagaggtg 
atcactagtg 
gagatgctct 


360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2018 


20 


25 


30 


35 


40 


45 


55 


ttgatgaggt 
trgctgatat 
tgtctttcct 
tcacttgtgt 
ctttgaagaa 
gttatacact 
taccttcaga 
gagaaatgct 
gagccataat 
ttgactatgg 
cgaagctgaa 
gttttaatct 
cagtatcatc 
catctgagga 
attcaggaca 
accacactct 
aactaaagag 
acaacactaa 
gtccaacata 
gtaagacttt 
accatactct 
aatggaaatt 
atttgtctag 
ttcaagaggc 
te 


<210> 45 
<211> 1050 
<212> DNA 


taccacaaca 
caatggtaag 
tgagaaggat 
tgtaataccc 
agtgccagtt 
tgaggaagct 
agcacctaat 
tgctcatgct 
ggcaaccatc 
tgtccgattc 
ctctctaaat 
tgaagaggct 
accagatgct 
gcactttgta 
gcgtacagag 
ggagagcccc 
tctcttatcc 
tctccacaca 
cttggatggt 
ctttgtacta 
tgatgagagt 
tcctcaagtt 
tgttttatta 


ttattataga 


<213> CORONAVIRUS 


<400> 45 
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ctggaagaaa 
ctttaccatg 
gcaccttaca 
tccaaaaagg 
gatgagtata 
aagactgctc 
gctaaggaag 
gaagagacaa 
caacgtaagt 
ttcttttata 
gagccgcttg 
gcgcgctgta 
gttactacat 
gaaacagttt 
ttaggtgttg 
gtcgagtttc 
ctgcgggagg 
cagcttgtgg 
gctgatgtta 
cctagtgatg 
tttcttggta 
ggtggtttaa 
gcacttcaac 


gcccgtgctg 


ctaagtttct 
attctcagaa 
tggtaggtga 
ctggtggcac 
taaccacgta 
ttaagaaatg 
agattctagg 
gaaaattaat 
ataaaggaat 
ctagtaaaga 
tcacaatgcc 
tgcgttctct 
ataatggata 
ctttggctgg 
aatttcttaa 
atcttgacgg 
ttaagactat 
atatgtctat 
caaaaattaa 
acacactacg 
ggtacatgtc 
cttcaattaa 
agcttgaagt 
gtgatgctgc 


taccaataag 
catgcttaga 
tgttatcact 
tactgagatg 
ccctggacaa 
caaatctgca 
aactgtatcc 
gcctatatgc 
taaaattcaa 
gcctgtagct 
aattggttat 
taaagctcct 
cctcacttcg 
ctcttacaga 
gcgtggtgac 
tgaggttctt 
aaaagtgttc 
gacatatgga 
acctcatgta 
tagtgaagct 
tgctttaaac 
atgggctgat 
caaattcaat 


taacttttgt 


ttactcttgt 
ggtgaagata 
agtggtgata 
ctctcaagag 
ggatgtgctg 
ttttatgtac 
tggaatttga 
atggatgtta 
gagggcatcg 
tctattatta 
gtgacacatg 
gccgtagtgt 
tcatcaaaga 
gattggtcct 
aaaattgtgt 
tcacttgaca 
acaactgtgg 
cagcagtttg 
aatcatgagg 
ttcgagtact 
cacacaaaga 
aacaattgtt 
gcaccagcac 


gcactcatac 


atatgtctat gacatatgga cagcagtttg gtccaacata cttggatggt gctgatgtta 


caaaaattaa acctcatgta aatcatgagg gtaagacttt ctttgtacta cctagtgatg 


138 


60. 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1442 


60 
120 


20 


25 


30 


35 


40 


45 


50 


55 


acacactacg 
ggtacatgtc 
cttcaattaa 
agcttgaagt 
gtgatgctgc 
ttggtgatgt 
agcgagttct 
tagaagctgt 
ttccatgtgt 
ttatgatgtc 
atgagtacac 
tctatcgtat 
atgttttcta 
atggagttac 
cttactatac 


ttgataattt 


<210> 46 
<211> 1995 
<212> DNA 


tagtgaagct 
tgctttaaac 
atgggctgat 
caaattcaat 
taacttttgt 
cagagaaact 
taatgtggtg 
gatgtatatg 
gtgtggtcgt 
tgcaccacct 
tggtaactat 
tgacggagct 
caaggaaaca 
ttacacagag 
agagcagcct 


caaactcaca 


<213> CORONAVIRUS 


<400> 46 
tttgtgcact 
aaactatgac 
tggtgtgtaa 
atatgggtac 
gtcgtgatgc 
cacctgctga 
actatcagtg 
gagctcacct 
aaacatctta 
cagagattga 
agcctataga 


tcacatgttc 


catactcgct 
ccatcttcta 
acattgtggt 
tctatcttat 
tacacaatat 
gtataaatta 
tggtcattac 
tacaaagatg 
cactacaacc 
accaaaattg 
ccttgtacca 


taacacaaaa 
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ttcgagtact 
cacacaaaga 
aacaattgtt 
gcaccagcac 
gcactcatac 
atgacccatc 
tgtaaacatt 
ggtactctat 
gatgctacac 
gctgagtata 
cagtgtggtc 
caccttacaa 
tcttacacta 
attgaaccaa 
atagaccttg 


tgttctaaca 


tacagtaata 
cagcatgcta 
cagaaaacta 
gataatctta 
ctagtacaac 
cagcaaggta 
actcatataa 
tcagagtaca 
atcaagcctg 
gatgggtatt 
actcaaccat 


tttgctgatg 


accatactct 
aatggaaatt 
atttgtctag 
ttcaagaggc 
tcegcttacag 
ttctacagca 
gtggtcagaa 
cttatgataa 
aatatctagt 
aattacagca 
attacactca 
agatgtcaga 
caaccatcaa 
aattggatgg 


taccaactca 


aaactgttgg 
atttggaatc 
ctaccttaac 
agacaggtgt 
aagagtcttc 
cattcttatg 
ctgctaagga 
aaggaccagt 
tgtcgtataa 
ataaaaagga 
taccaaatgc 


atttaaatca 


139 


tgatgagagt 
tcctcaagtt 
tgttttatta 
ttattataga 
taataaaact 
tgctaatttg 
aactactacc 
tcttaagaca 
acaacaagag 
aggtacattc 
tataactgct 
gtacaaagga 
gcctgtgtcg 
gtattataaa 


accattacca 


cgagcttggt 
tgcaaagcga 
gggtgtagaa 
ttccattcca 
ttttgttatg 
tgcgaatgag 
gaccctctat 
gactgatgtt 
actcgatgga 
taatgcttac 
gagttttgat 


aatgacaggc 


tttcttggta 
ggtggtttaa 
gcacttcaac 
gcccgtgctg 
gttggcgagc 
gaatctgcaa 
ttaacgggtg 
ggtgtttcca 
tcttcttttg 


ttatgtgcga 


aaggagaccc | 


ccagtgactg 
tataaactcg 
aaggataatg 
aatgcgagtt 


gatgtcagag 
gttcttaatg 
gctgtgatgt 
tgtgtgtgtg 
atgtctgcac 
tacactggta 
cgtattgacg 
ttctacaagg 
gttacttaca 
tatacagagc 
aatttcaaac 


ttcacaaagc 


180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1050 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 


20 


25 


30 


35 


40 


45 


50 


55 


cagcttcacg 
ttgactatag 
ttgtttggca 
tacgttgtct 
tagaagacac 
aagtagtgga 
aagttgtagg 
taggtcatga 
ctaatgagct 
ttaatagtgt 
caattacaac 
cttatgtgtt 
ttagagcttc 
gtttggatgc 
ctatgtggct 
ttggtgtact 
atcttaattc 
tttgtttaag 
cgatttcatc 
catatatgtt 
tctttggcta 
gtattgtaca 


<210> 47 
<211> 1884 
<212> DNA 


agagctatct 
acactattca 
cattaaccag 
ttggagtaca 
acaaggaatg 
aaatcctacc 
caatgtcata 
ggatcttatg 
ttcactagcc 
tccttggagt 
atcaaattgc 
tacattattg 
actacctaca 
cggcattaat 
attgttgtta 
cttatctaat 
gtctaacgtt 
tggattagac 
gtacaagcta 
gttcacaaaa 
ttttgctagt 
aatgg 


<213> CORONAVIRUS 


<400> 47 


aattcttggc 
gttaggatgt 
atggatggtt 
gttgagtgta 
ggccgtggct 
ggtagtacat 


tcatgtggtt 
acatcttctt 
gcacctcttc 
caactattgt 
tctgcaagac 


tcattagtga 
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gtcacattct 
gcgagtttca 
gctacaacca 
aagccagtag 
gacaatcttg 
atacagaagg 
cttaaaccat 
gctgcttatg 
ttaggtttaa 
aaaattttgg 
gctaagagat 
ttccaattgt 
actattgcta 
tatgtgaagt 
agtatttgct 
tttggtgctc 
actactatgg 
tcccttgatt 
gacttgacaa 
ttcttttatt 


catttcatca 


tatcattagt 
tgcttctttc 
gacttgcatg 
taatggcatg 
tcacaattgg 
tgaagttgct 


tcccagactt 
agaaaggtgc 
agacaacgtt 
atacttcaaa 
cttgtgaaag 
aagtcataga 
cagatgaagg 
tggaaaacac 
aaacaattgc 
cttatgtcaa 
tagcacaacg 
gtacttttac 
aaaatagtgt 
cacccaaatt 
taggttctct 
cttcttattg 
atttctgtga 
cttatccage 
ttttaggtct 
tattaggtct 
gcaattcttg 


gaatggcgat 
taaattactg 
caaaccaaac 
ttcatttgaa 
tcaacaaccc 
gtgtgacgtg 
tgttaaagta 
aagcattacc 
cactcatggt 
accattctta 
tgtgtttaac 
taaaagtacc 
taagagtgtt 
ttctaaattg 
aatctgtgta 
taatggcgtt 
aggttctttt 
tcttgaaacc 
ggccgctgag 
ttcagctata 
gctcatgtgg 


attgtacaaa tggcacccgt 


tactacatat ggaagagcta 


atgtgctata agcgcaatcg 


aagagatctt tctatgtcta 


aattgtctca attgtgacac 


cgtgatttgt cactccagtt 


140 


gtagtggcta 
cataagccaa 
acttggtgtt 
gttctggcag 
acctctgaag 
aaaactaccg 
acacaagagt 
attaagaaac 
attgctgcaa 
ggacaagcag 
aattatatgc 
aattctagaa 
gctaaattat 
ttcacaatcg 
actgctgctt 
agagaattgt 
ccttgcagca 
attcaggtga 
tgggttttgg 
atgcaggtgt 
tttatcatta 


ttctgcaatg 
tgttcatatc 
tgccacacgc 
tgcaaatgga 
attttgcact 


taaaagacca 


780 

840 

900 

960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
1995 


60 
120 
180 
240 
300 
360 


20 


25 


30 


35 


40 


45 


50 


55 


atcaacccta 
cttcacctct 
tttgtcaatt 
atagtttttg 
tacagtcagc 
ggagatagta 
acttttagtg 
gcaaagggtg 
gttgttgata 
tctgacttag 
gaaaacatga 
gcccaagtag 
ttatctgaac 
agactaactt 
aagggtggta 
gttcttgctg 
ggttacacaa 
atttctactg 
cgtggtggtt 
gagattggtt 
ttcttgcatt 
aaactcattg 
atttttaagg 
ggttctattt 
atcatacagt 


gctgagtact 


<210> 48 
<211> 2020 
<212> DNA 


ctgaccagtc 
actttgacaa 
tagacaattt 
atggcaagtc 
tgatgtgcca 
ctgaagtttc 
ttcctatgga 
tagctttaga 
ccgatgttga 
aagtgacagg 
cgcccagaga 
caaaaagtca 
agctgcgtaa 
gtgctacaac 
agattgttag 
cattggtttg 
atgaaatcat 
atgattgttt 
catacaaaaa 
tcatagtgcec 
ttctacctcg 
agtatagtga 
atgctatggg 
cttatagtga 
ttcctaacac 


gtagacatgg 


<213> CORONAVIRUS 


<400> 48 


cactcgttat gtgcttatgg atggttccat catacagttt cctaacactt acctggaggg 


ttctgttaga gtagtaacaa cttttgatgc tgagtactgt agacatggta catgcgaaag 


EP 1 694 829 B1 


atcgtatatt 
ggctggtcaa 
gagagctaac 
caaatgcgac 
acctattctg 
cgttaagatg 
aaaacttaag 
tggtgtcctt 
cacaaaggat 
tgacagttgt 
tcttggcgca 
caatgtttca 
acaaattcgt 
tagacaggtt 
tacttgtttt 
ttatatcgtt 
tggttacaaa 
tgcaaataaa 
tgacaaaagc 
tggcttaccg 
tgtttttagt 
ttttgctacc 
caaacctgtg 
gcttcgtcca 
ttacctggag 


taca 


gttgatagtg 
aagacctatg 
aacactaaag 
gagtctgctt 
ttgcttgacc 
tttgatgctt 
gcacttgttg 
tctacattcg 
gttattgaat 
aacaatttca 
tgtattgact 
ctcatctgga 
agtgctgcca 
gtcaatgtca 
aaacttatgqc 
atgccagtac 
gccattcagg 
catgctggtt 
tgccctgtag 
ggtactgtge 
gctgttggca 
tctgcttgcg 
ccatattgtt 
gacactcgtt 
ggttctgtta 


141 


ttgctgtgaa 
agagacatcc 
gttcactgcc 
ctaagtctgc 
aagctcttgt 
atgtcgacac 
ctacagctca 
tgtcagctgc 
gtctcaaact 
tgctcaccta 
gtaatgcaag 
atgtaaaaga 
agaagaacaa 
taactactaa 
ttaaggccac 
atacattgtc 
atggtgtcac 
ttgacgcatg 
tagctgctat 
tgagagcaat 
acatttgcta 
ttcttgctgc 
atgacactaa 
atgtgcttat 
gagtagtaac 


aaatggcgcg 
gctctcccat 
tattaatgtc 
ttctgtgtac 
atcagacgtt 
cttttcagca 
cagcgagtta 
ccgacaaggt 
ttcacatcac 
taataaggtt 
gcatatcaat 
ctacatgtct 
catacctttt 
aatctcactc 
attattgtgc 
aatccatgat 
tcgtgacatc 
gtttagccag 
cattacaaga 
caatggtgac 
cacaccttcc 
tgagtgtaca 
tttgctagag 
ggatggttcc 
aacttttgat 


420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1884 


60 
120 


20 


25 


30 


35 


40 


45 


50 


55 


gtcagaagta 
cagagctcta 
tactcctctt 
tattattgcc 
tggtgagtac 
actctgtctg 
cttgacattc 
gttttctcct 
gcactgccat 
atttagtacc 
aaaattgcgt 
taacaagtac 
ctgccactta 
accaccacag 
cccgtcaggc 
tggattgtgg 
catgcttaat 
tcaggctggc 
gcttaaagtt 
tggtcaaaca 
tgccatgaga 
tggttttaac 
aacaggagta 
acaaactgca 
gtatgctgct 
tgactttaac 
catattggga 
gaaagagctg 
agatgagttt 
gttcaagaaa 
attgattctt 
cttgccattt 


<210> 49 
<211> 2040 
<212> DNA 


ggtatttgcc 
tcaggagttt 
gtgcaacctg 
atattggtga 
aaccatgttg 
gtaccagctt 
tatttcacca 
attgtgcectt 
tggttcttta 
ttcgaggagg 
agcgagacac 
aagtatttca 
gcaaaggctc 
acatcaatca 
aaagttgaag 
ttggatgaca 
cctaactatg 
aatgttcaac 
gatacttcta 
ttttcagttc 
cctaatcata 
attgattatg 
cacgctggta 
caggctgcag 
gttatcaatg 
cttgtggcaa 
cctctttctg 
ctgcagaatg 
acaccatttg 
attgttaagg 
gttcaaagta 


actcttggta 
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tatctaccag 
tctgtggtgt 
tgggtgcttt 
cttgtgctgc 
ttgctgctaa 
acagctttct 
atgatgtttc 
tttggataac 
acaactatct 
ctgctttgtg 
tgttgccact 
gtggagcctt 
taaatgactt 
cttctgctgt 
ggtgcatggt 
cagtatactg 
aagatctgct 
ttcgtgttat 
accctaagac 
tagcatgcta 
ccattaaagg 
attgcgtgtc 
ctgacttaga 
gtacagacac 
gtgataggtg 
tgaagtacaa 
ctcaaacagg 
gtatgaatgg 
atgttgttag 
gcactcatca 
cacagtggtc 


ttatggcaat 


tggtagatgg 
tgatgcgatg 
agatgtgtct 
ctactacttt 
tgcacttttg 
gccgggagtc 
attcttggct 
agcaatctat 
taggaaaaga 
tacctttttg 
tacacagtat 
agatactacc 
tagcaactca 
tctgcagagt 
acaagtaacc 
tccaagacat 
cattcgcaaa 
tggccattct 
acccaagtat 
caatggttca 
ttctttcctt 
tttctgctat 
aggtaaattc 
aaccataaca 
gtttcttaat 
ctatgaacct 
aattgccgtc 
tcgtactatc 
acaatgctct 
ttggatgctt 
actgtttttc 


tgctgcatgt 


142 


gttcttaata 
aatctcatag 
gcttcagtag 
atgaaattca 
tttttgatgt 
tactcagtct 
caccttcaat 
gtattctgta 
gtcatgttta 
ctcaacaagg 
aacaggtatc 
agctatcgtg 
ggtgctgatg 
ggttttagga 
tgtggaacta 
gtcatttgca 
tccaaccata 
atgcaaaatt 
aaatttgtcc 
ccatctggtg 
aatggatcat 
atgcatcata 
tatggtccat 
ttaaatgttt 
agattcacca 
ttgacacaag 
ttagatatgt 
cttggtagca 
ggtgttacct 
ttaactttct 
tttgtttacg 


atgagcatta 
ctaacatctt 
tggctggtgg 
gacgtgtttt 
ctttcactat 
tttacttgta 
ggtttgccat 
tttctctgaa 
atggagttac 
aaatgtacct 
ttgctctata 
aagcagcttg 
ttctctacca 
aaatggcatt 
caactcttaa 
cagcagaaga 
gctttcttgt 
gtctgcttag 
gtatccaacc 
tttatcagtg 
gtggtagtgt 
tggagcttcc 
ttgttgacag 
tggcatggct 
ctactttgaa 
atcatgttga 
gtgctgcttt 
ctattttaga 
tccaaggtaa 
tgacatcact 


agaatgcttt 


180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2020 


20 


25 


30 


35 


40 


45 


50 


55 


<213> CORONAVIRUS 


<400> 49 


agcatttcca 
taggttgttt 
tgtaacaaac 
agggaatcta 
tcccttcgaa 
accagccgca 
aacagctgag 
gtccatgtta 
ttcccagagt 
ataatcaggg 
aacacaacca 
aagcatagtg 
tcttgcctgt 
catggcagca 
gagaacgact 


ataagcggca 


“gttatcgagc 


aacagacaaa 
atcattgtgg 
ttgaagaacc 
agtagcaacc 
agcatcaata 
tgtagagacc 
gaaaaggcca 
ctgtaaggtg 
agctctagct 
aactaaggcc 
aagtgtaatg 
agctgtcatg 


ataaccagac 


gcctgaagac 
aagcctttga 
ctacaaggtg 
gcccatttga 
ttgttatagt 
caggacatct 
ttggctctta 
atttcactaa 
gcagatgcat 
acaacaacca 
tcacgcgcat 
aagagcattg 
ttgtacattt 
tcacggtcaa 
tcagaatcac 
tatgatggta 
atttcctcgc 
agagaaacca 
agttgtacac 
gagagcagta 
ttgatacatg 
ctactcttag 
aagtagtcat 
aagtagcagc 
ttgccagtaa 
aaaaacatga 
cacatggaaa 
acattcatca 
agaataagca 


aagctagtgt 
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gtactgtagc 
tgaagtacaa 
gttccagttc 
gatcttggtg 
aggcaagtgc 
gtcgtagtgc 
gagctgtaac 
gttgaacaat 
atgtaaaggt 
tgagtttggc 
tgttgataat 
tttgcatage 
gggtcatagc 
actcagattt 
cattagctac 
aagaactaaa 
acaacctatt 
tcttctcgaa 
attgtgccca 
ccacagatgt 
gtttacctcc 
gaggcaaaag 
aaacaccaag 
agcaacaata 
taaataacaa 
tagtcgtaac 
tagcttgatc 
gtgtccaaac 
aaactaaagc 


cagccaattc 


agctaaactg 
gtatttcact 
tgtgtaaatt 
gtctgatagt 
attgtcatca 
tactggactc 
aataagaggc 
cttgctatcc 
gttaccatca 
tgctgtagtc 
gttgttaagt 
actagttact 
ctgatctgcc 
agccacattc 
agcctgctca 
ttctgaagca 
aatgtctaca 
agcttcagtt 
caatttagaa 
gcactttacg 
aatacccaac 
cccctgggag 
agtaagcctg 
gcctaagaaa 
tgggtaatac 
gacaccagaa 
taaagcatta 
acgtctagca 
tgaagcatac 


aagccatgtc 


143 


cccagcacca 
ttaggccctt 
gtacctgtac 
aatgccagca 
gtacaagctg 
agttcattat 
caagccaaat 
gcatcaacaa 
caagtgttct 
aatggtatga 
gcatcattat 
tttgccctct 
atcttttcca 
aaagatttct 
taggcctcct 
atagcctgaa 
gcaccctgca 
gtgtcttttg 
gatgactcta 
tcagacattt 
aacttaatgt 
ttcatatacc 
aagtaacggt 
caataaacaa 
tcaacacaca 
tagttagagg 
ccatagtaga 
gcatcatcat 
ataacacaat 


atgatacgca 


tacctctatt 
ttggtgtgtc 
catcactctt 
caaacctacc 
tttgtgtggt 
tctgtagttt 
ttggtgaatt 
cttgctggat 
tgtaggtacc 
tgttgagtgg 
caagcttcct 
tgtcctcaga 
acttgcgttg 
ttaacttttt 
gggcagtggc 
gagtagcacg 
tggatagcaa 
caagaagaat 
ctctaagttg 
tagactgtac 
taagcttgaa 
taaattcttg 
tgagtaaaca 
gcatgataca 
caaacactat 
ttacagaaat 
ctttgtaaac 
aaacagtgcg 
ccttaagect 


tcacccagct 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 


20 


25 


30 


35 


40 


45 


50 


55 


agcaggcatg tagaccatat 


gcacaagaat gcgtgcttat 


accaagagta aatggcaaga 


actttgaaca agaatcaata 


<210> 50 
<211> 2012 
<212> DNA 


<213> CORONAVIRUS 


<400> 50 


cttgtaggtt 
aaggcttaaa 
ttcaggctgg 
ttgcagtaga 
ccaactgtgt 
cagaagctaa 
gccacattga 
tacctaccac 
tctgcggaat 
agtctgcgga 
accgtgcggc 
aaaagttgct 
tgaggaaggc 
ccaacatgaa 
ctttttcaag 
taaatacaca 
tacattaaaa 
ggattggtat 
gcgtgtacgc 
cattgtaggc 
tgatttcgta 
gctgatgccc 
tctcgcaaaa 


ttgtctcttc 


tgttacagac 
caacctaaat 
aaatgctaca 
ccctgctaaa 
gaagatgttg 
catggaccaa 
ccatccaaat 
ttgtgctaat 
gtggaaaggt 
tgcatcaacg 
acaggcacta 
ggttttgcaa 
aatttattag 
gagactattt 
tttagagtag 
atggctgatt 
gaaatactcg 
gacttcgtag 
caatcattat 
gtactgacat 
caagtagcac 
atcctcactt 
ccacttatta 


gaccgttatt 
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taaagtaagc 
gcttaacaag 
aagcattctc 


gtgatgtcaa 


acaccaaaag 
agaggtatgg 
gaagtacctg 
gcatataagg 
tgtacacaca 
gagtcctttg 
cctaaaggat 
gacccagtgg 
tatggctgta 
tttttaaacg 
gtactgatgt 
agttcctaaa 
actcttactt 
ataacttggt 
atggtgacat 
tagtctatgc 
tcacatacaa 
agaatcctga 
taaagactgt 
tagataatca 
caggctgcgg 
tgactagggc 
agtgggattt 
ttaaatattg 


aactgttgca agagaaggta acagaaacaa 


cagcatagca catgcagcaa ttgccataat 


gtaaacaaag aaaaacagtg accactgtgt 


gaaagttaaa agcatccaat gatgagtgca 


ggcctaaagt 
tgctgggcag 
ccaattcaac 
attacctagc 
ctggtacagg 
gtggtgcttc 
tctgtgactt 
gttttacact 
gttgtgacca 
ggtttgcggt 
cgtctacagg 
aactaattgc 
tgtagttaag 
taaagattgt 
ggtaccacat 
tctacgtcat 
ttgctgtgat 
catcttacgc 
acaattctgc 
ggatcttaat 
agttcctatt 
attggctgct 
gctgaaatat 


ggaccagaca 


144 


gaaatacttg 
tttagctgct 
tgtgctttcc 
aagtggagga 
acaggcaatt 
atgttgtctg 
gaaaggtaag 
tagaaacaca 
actccgcgaa 
gtaagtgcag 
gcttttgata 
tgtcgcttcc 
aggcatacta 
ccagcggttg 
atatcacgtc 
tttgatgagg 
gatgattatt 
gtatatgcta 
gatgctatgc 
gggaactggt 
gtggattcat 
gagtcccata 
gattttacgg 


taccatccca 


tacttcatca 
acagtacgtc 
ttctgtgctt 


caaccaatca 


actgtaacac: 


tattgtagat 
tacgtccaaa 
gtctgtaccg 
cccttgatgc 
cccgtcttac 
tttacaacga 
aggagaagga 
tgtctaacta 
ctgtccatga 
agcgtctaac 
gtaattgtga 
tcaataagaa 
acttaggtga 
gtgatgcagg 
acgatttcgg 
attactcatt 
tggatgctga 
aagagagact 


attgtattaa 


1860 
1920 
1980 
2040 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 


20 


25 


30 


35 


40 


45 


50 


55 


ctgtttggat 
gtttccacct 
tgttgtttca 
cttacatagc 
gcatgcagct 
actaacaaac 
tgactttgct 
cttctttgct 
gccaacaatg 


tgattgttac 


<210> 51 
<211> 1877 
<212> DNA 


gataggtgta 
acaagttttg 
actggatacc 
tcgcgtctca 
tctggcaatt 
aatgttgctt 
gtgtctaaag 
caggatqgca 
tgtgatatca 


gatggtggct 


<213> CORONAVIRUS 


<400> 51 


gtacttcgcg 
gcgtttctgc 
cagcattagt 
cacatgtgtt 
gaggcttatg 
tgacatcaca 
atgttgaaat 
caccgcaacg 
ctgtatgtgg 
cattagttag 
ttctaatgta 
taagtgggta 
ttttgacaat 
gcaggtacac 
gaggtccttt 
tttgataata 
agttactgtt 
gcaggtaagc 


tacagtggca 
tgcgaaaagc 
ccaatcacat 
tttgtataaa 
tgacttgcaa 
acctggggca 
gacatggtca 
aagtgaagtc 
tgtgtacata 
cattacggaa 
ttgtaaatac 
agcatcaata 
atcatcgaca 
gtaatcatct 
agtaaggtca 
aagaactgcc 
atagcacaca 


gtaaaactca 


EP 


tecttcattg 
gaccactagt 
attttcgtga 
gtttcaagga 
tattgctaga 
ttcaaactgt 
gtttctttaa 
acgctgctat 
gacaactcct 


gtattaatgc 


ataccatatg 
ttgagtctct 
gttgctatcg 
cCaaaaacct 
taatagctca 
ttgcaaacat 
tagcagcact 
tgtgaattgc 
gcctcataaa 
tacatgtcca 
aagtgaaaga 
gccagtgaca 
aaacagcctg 
ccttgtttaa 
gtctcagtcc 
ttaaagttct 
acggcatcat 


tcecacgaatt 
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tgcaaacttt 
aagaaaaata 
gttaggagtc 
acttttagtg 
taaacgcact 
caaacccggt 
ggaaggaagt 
cagtgattat 
attcgtagtt 


ca 


acagcttaaa 
cagtacaagt 
cattgaagtc 
gaccattagc 
tacctcctag 
agggattaac 
tgcaacatag 
acaatacaca 
actcaggttc 
acatgtggcc 
catcagcata 
cgaacctttc 
cgcctaatat 
ctagcattgt 
aacattttgc 
taatgctagc 
cagaaagaat 


catgatcaac 


145 


aatgtgttat 
tttgtagatg 
gtacataatc 
tatgctgctg 
acatgctttt 
aattttaata 
tctgttgaac 
gactattatc 


gaagttgttg 


tgtttcctca 
gttggcaagt 
agtgacattg 
acataatgga 
atacagttgt 
agacaacact 
gaatggtctc 
agcacctaca 
ccagtaccgt 
agtaagctca 
ctcctgatta 
aatcataagt 
tcttgatgga 
atgctgtgag 
ctcagacatg 
tactaaacct 
catcatggag 
atccctattt 


tttctactgt 
gtgttccttt 
aggatgtaaa 
atccagctat 
cagtagctgc 
aagactttta 
taaaacactt 
gttataatct 


ataaatactt 


gtggctttga 
atgtaatcgc 
tcactgccta 
aaactaatgg 
gtcacatcag 
aatttgtgtg 
ctaatacagg 
gcctgcaaga 
gaggtgttat 
tcatgtaact 
ggatgttttg 
gtaccatctg 
tctgggtaag 
caaaattcgt 
aacacattat 
tgagccgcat 
aaatgtttac 


ctatagagac 


1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2012 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 


20 


25 


30 


35 


40 


45 


50 


55 


actcatagag 
ttgaaagaag 
cataagcagt 
cacacatgac 
gtgataagtt 
gcatgttagg 
ctacatcact 
caattaccac 
gtctatttgt 
cactaatggc 
acgcgaaaag 
cccatttatt 
cattaataca 


ggagttgtct 


<210> 52 
<211> 2051 
<212> DNA 


cctgtgttgt 
tgcatttaca 
tgtagcatca 
catctcactt 
acagcaagtg 
catggctctg 
gtaaacagtt 
agtagctcct 
catagtacta 
atacttaaga 
tgcatcttga 
aaatgggaaa 
gccaccatcg 


gatatca 


<213> CORONAVIRUS 


<400> 52 


tcaggtccaa 
acgaacacga 
atacgcacta 
tcacctggtg 
taaccagtcg 
ttagtaccca 
cgaacgtgac 
taattcattt 
cctggtatgt 
ggtgcctgtg 
acattttctg 
agtttgtcat 
atagccacat 


atgacatagt 


tcttgacaaa 
ctctgtctga 
cattccaggg 
gaggttttgc 
gtacagctac 
cagcatctct 
gaatagcttc 
tgaaacccat 
caacacataa 
taggatgaag 
cttgtaatgt 
aaagatctct 
tgaagcggtt 


catattcaga 
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agattgcgga 
ttggctgtaa 
ccggatgatg 
aatacttgcg 
ttatgtttgc 
tcacattttg 
tttaacatat 
ctagtggcgg 
cagatagaga 
ttcatttgag 
tcctcataac 
ccagctgatt 


taacaatcaa 


gtacttcatt 
caatcctttc 
caagccttta 
attaactctg 
taagttaaca 
agttgcatga 
ttcgcgggtg 
catagagatg 
tccttcagtc 
accagtaatg 
agccacattg 
atcagacatt 
gacattacaa 


accctgtgat 


catacttgtc 
cagcttgaca 
ttccacctgg 
cacactcgtt 
gagcaagaac 
gataatccca 
tatgccagcc 
ctattgactt 
caccagctac 
ttatagtagg 
tcattgagtc 
tatccagatt 


agtatttatc 


gatgtaagct 
agtgtatcac 
tacatgagtg 
gtgaattctg 
cctgtagaaa 
cagccctcta 
ataaacatat 
agtctacggt 
ttgaacttta 
atcttactac 
cgacgtggta 
atgcacaaaa 
gagtgtgctg 
gaatcaacag 
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agctatctta 
aatgttaaag 
tttaacatat 
agctaacctg 
aagagaggcc 
acccataagg 
accgtaaaac 
caataatttc 
ggtgcgagct 
gatgacatta 
ataataaagt 
gttaacgatt 


aacaacttca 


Caaagccatg 
tgagcatttg 
gtataagatg 
tgttattttc 
atcctagctg 
catcaaagcc 
tagggtaacc 
aggtcatgtc 
tatcaacgct 
agtccttaaa 
tttctagact 
tgccaatttt 
tttcagtagt 
tctgcgtagg 


ttaccatcag 
acactattag 
agtgagccgc 
tagaaacggt 
attatcctaa 
tgtggagttt 
ttgcttgttc 
tgatgaaact 
ctattctttg 


cgcttagtat 


ctagccttac. 


acttggttgg 


actacgaata 


cgcccaaagg 
tactatctta 
tttaaactgg 
agtgtcaaca 
gagaggtagg 
aatccacgca 
attgacttgg 
ctttggtatg 
gaggtgtgta 
aagtccagtt 
tgtaaattgc 
tgcccttgtg 
ttgtgtgaat 


caatcctaag 


1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1877 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 


20 


25 


30 


35 


40 


45 


50 


55 


atttttgaag 
gcaggattgc 
gaaacatcat 
ttgtgtgctt 
ggacaacggc 
actgaattaa 
aattgagcag 
ctcaagtcat 
tctggcaatg 
ttatcaaaac 
aaatatttta 
actatgcgag 
ccaggtggtc 
ttgctagaaa 
tgctcttgtg 
aagtaatcac 
tagtcacctt 
taaccagtaa 
agatgcaatt 
aatgtttcct 


gtgttggcaa 


<210> 53 
<211> 2075 
<212> DNA 


ctacagcgtt 
gtgtaagaaa 
gtgtaataac 
ttagcttatt 
gacaagttcc 
aatattctgg 
gatcgccaat 
aattagtagc 
catttacagt 
actctacgcg 
atgccttttc 
cagatgggta 
cttggagtgt 
actcatctga 
gcactagagt 
caacattcaa 
tttcaaaggt 
agacatagtt 
ctctgtcaga 
cagtggcttt 
g 


<213> CORONAVIRUS 


<400> 53 


tgcttgtagt 
aatttcagca 
ctttattatc 
tgaacctgtt 
atcctctaat 
accgccaagt 


gagcttatat 


tttgggtaga 
tagtcaattg 
tcgacaaagt 
tgcgcatctg 
ttaagtggtg 
tgtccatgac 


cgctgtatga 
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ctgtgaatta 
ttctcttaca 
acctttgtag 
gtcataaact 
aaggaacatg 
ttctagtgtg 
atagacgtag 
catagagatt 
gcagaaaaca 
cgcacgcgca 
acatagggca 
atagagagca 
agagtacttt 
gatgttgagt 
aggtgcacta 
cttgtatgtc 
gtactctcca 
tctgttcaat 
gagtacttcg 
gagcgtttct 


aggtttcaac 
taaccttgac 
catcaagtaa 
ttatgaagta 
aatcttgtga 
tgaaatctcc 


attcatccat 


taaggtgaga 
acgcctattt 
aacattttga 
aaagcactca 
tctggaccta 
cctttagtca 
tgttttgcac 
tcatcaaaga 
tactgttcta 
ggtatgattc 
tcaacagctg 
agtccgatgg 
tgcatgccga 
gttgggtaca 
agtggcatta 
gtagtacctc 
atctgtactt 
ggtggtctag 
cgtacagtgg 


gctgcgaaaa 


atgtccatcc 
cacttttgaa 
aagatcaatc 
atttttcact 
gcgcttggct 
ataaacgatg 


agcgagctcg 
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taaaaacagc 
gaggtctgtt 
agcattgagc 
cagtgtcaac 
ttgttttcat 
gcaatgtgcg 
gaagtctagc 
ctacaatgtc 
gtgttgaatt 
tactacattt 
catgagagca 
caaaatgact 
ccttttgata 
agccagtaat 
cagtgtgaga 
tgtacacaac 
tactattttt 
gttttccaac 
caataccata 


gcttgagtct 


ttacaccaaa 
atcactgaca 
acagaacaca 
gtgctgtcca 
aagcctatca 
tgttcgaagg 


agaaagtcag 


ttttctccaa 
gattgcagat 
tgacttatcc 
aatttcagca 
aagtctgcac 
gggggctggt 
attgacaaca 
agcagttgtt 
cactttgaat 
atctatgggc 
tgccgtatac 
cttaccagta 
atttgcaaca 
tctcacatag 
tgtcaacaca 
agcatcacca 
agttacacgg 
ctcccatgaa 
tgacagctta 


ctcagtacaa 


gcatgaatga 
aatcttgtga 
cacattttga 
tagggataaa 
ttaaatgaag 
catagccctc 


tttccatttg 


900 

960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2051 


60 
120 
180 
240 
300 
360 
420 


20 


25 


30 


35 


40 


45 


50 


55 


tgatctgggc 
ttgaataatg 
taatgtgact 
tgaaccttct 
cactctacca 
aatgtcagtc 
gtcccagatt 
tggcactggt 
tgtcttattt 
aatgatggaa 
ataagccaca 
aaattgtttg 
gtactgtcgg 
aatacacgta 
agactcacaa 
acttttatcg 
acagcctggt 
ggctgggtaa 
gtgatgtgta 
ctgagcatcg 
atttccaatg 
gtgttgtact 
aacagaccaa 
agcatcacaa 
ctgaaggtta 
gtcaaaaccc 
tgcacgtttg 
tgatgtaagc 


<210> 54 
<211> 1891 
<212> DNA 


ttaaaatcct 
ccgtctactt 
ccattgacgc 
gttattaaaa 
tcaaacaaga 
attgtgcaga 
acagtattag 
ttaatgttac 
tcaaagatct 
acaggtgctt 
ttttctaaac 
taaatccata 
tactcatttg 
gcagatttga 
ggactatcag 
aaagctggag 
aagttcaagt 
cgatcaacgt 
gcataagaat 
tagaacttcc 
tcatgaagaa 
tttctgcaag 
tcaacgcgct 
ctagccacat 
cccgtaaagce 
acagaatgat 
tcacacagac 


tcaaagccat 


<213> CORONAVIRUS 


<400> 54 
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ctaagtctct 
tcttaaagta 
tagcttgtgc 
caccattacg 
cagtaagtga 
cacctattgt 
cagcgatatc 
gcttagccca 
ccacatcaat 
cgccggcgtg 
tctgtaacct 
ggctaaatcc 
catggtgtct 
gtggaacata 
aatagtaaaa 
tgtggaatgce 
ttgacaagac 
tacaattcca 
agaagagttc 
attctacttc 
ctggaaactt 
cagaattaac 
taacaaagca 
gtgcatttcc 
cccactgctg 
tccagcaggc 
aacacgttct 


gcgcccaaag 


gctctgagta 
gttaaactgt 
tggtcccttt 
ggcgtttcta 
agaacaagca 
agatacatgt 
aacacccaaa 
aagctcaaat 
accatctacc 
tccatcaaag 
ggtaaatgta 
agcagaaatc 
gcaaacagca 
atcaatatcc 
gaaaggcaat 
atgcttattc 
tcttgtgtca 
aaacaaacaa 
ctctattttg 
agcctgaggc 
atcagcaagc 
cctcagttca 
ctcatggact 
atgtacctgg 
aacatcaatc 
ataagtatct 
ttcaggtcca 


gacga 
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aagtaggttt 
gtttttactg 
gaaggtgtta 
aaaaggtcta 
ctctcagtag 
gctggggctt 
ttattgagta 
gcaacattaa 
tttgtgtaaa 
tgtcctttat 
ttccacaggt 
atcatattat 
ccacctaaat 
gacactactt 
tgctttaaat 
acatacaaac 
aacctacaca 
acaccatcag 
taagctttgt 
acacacttga 
aatgcagact 
tctcctataa 
gctaaacatc 
caatgttggt 
ataaatgggt 
gatgaagtag 


atcttgacaa 


caggcaactg 
attctccaat 
gacctttgac 
cctgtccttc 
gtttcttggc 
ctcttttgta 
tcttaatctc 
caggaagtgt 
cagcattatt 
taacaacatt 
tataagtatc 
atgcatccaa 
tgcatcgtgt 
gtttgccatg 
tagtaaatgc 
taccaccatc 
caattgcatt 
tgaatttatc 
cactacatgg 
tagcctttgg 
tcacaaccat 
tagggtattc 
tagtcatgat 
catggttact 
tatagacata 
aaaagcaagt 


agtacttcat 


480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2075 


20 


25 


30 


35 


40 


45 


50 


55 


aagattcacc 
tcataacaga 
ttgatgactt 
aggttacaat 
aaaccttcta 
acttgtacaa 
atgctgttat 
acttaaatac 
gctctgataa 
cactacttgt 
gagactgtgc 
accctaggac 
tgtgtggatt 
agcattcttg 
ttgttacaaa 
gcaagccgaa 
acacaaatcc 
aattaagagg 
ctcttctgga 
atattcttgt 
gtggtagtga 
aacatacttc 
tttatttaac 
ttaatcatac 
cagagaaatc 
agtcggtgat 
tgtgtgacaa 
tattcgataa 
tttcagaaaa 
ggtttctcta 
gttttaacac 


gagccattct 


<210> 55 
<211> 32 
<212> DNA 


acttaaatta 
tgcgcaaaca 
tgtcgagata 
tgactatgct 
cccaaaacta 
gatgcaaaga 
accaaaagga 
acttacttta 
aggagttgca 
cgattcagat 
aacagtacat 
caaacatgtg 
tataaagcaa 
gaatgctgac 
tgtaaatgca 
ggaacaaatt 
tatccagttg 
aactgctgta 
aaaaggtagg 
taacaactaa 
ccttgaccgg 
atctatgagg 
tcaggattta 
gtttggcaac 
aaatgttgtc 
tattattaac 
ccctttcttt 
tgcatttaat 
gtcaggtaat 
tgtttataag 
tttgaaacct 


tacagccttt 
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gaggatttta 
ggttcatcaa 
ataaagtcac 
gaaatttcat 
caagcaagtc 
atgcttcttg 
ataatgatga 
gctgtaccct 
ccaggtacag 
cttaatgact 
acggctaata 
acaaaagaga 
aaactagccc 
ctttacaagc 
teatcatcgg 
gatggctata 
tcttcctatt 
atgtctctta 
cttatcatta 
acgaacatgt 
tgcaccactt 
ggggtttact 
tttcttccat 
cctgtcatac 
cgtggttggg 
aattctacta 
gctgtttcta 
tgcactttcg 
tttaaacact 
ggctatcaac 
atttttaagt 


tcacctgctc 


tccctatgga 
aatgtgtgtg 
aagatttgtc 
tcatgctttg 
aagcgtggca 
aaaagtgtga 
atgtcgcaaa 
acaacatgag 
ctgtgctcag 
tcgtctccga 
aatgggacct 
atgactctaa 
tgggtggttc 
ttatgggcca 
aagcattttt 
ccatgcatgc 
cactctttga 
aggagaatca 
gagaaaacaa 
ttattttctt 
ttgatgatgt 
atcctgatga 
tttattctaa 
cttttaagga 
tttttggttc 
atgttgttat 
aacccatggg 
agtacatatc 
tacgagagtt 
ctatagatgt 
tgcctcttgg 


a 
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cagcacagtg 
ttctgtgatt 
agtgatttca 
gtgtaaggat 
accaggtgtt 
ccttcagaat 
gtatactcaa 
agttattcac 
acaatggttg 
cgcagattct 
tattattagce 
agaagggttt 
tatagctgta 
tttctcatgg 
aattggggct 
taactacatt 
catgagcaaa 
aatcaatgat 
cagagttgtg 
attatttctt 
tcaagctcct 
aatttttaga 
tgttacaggg 
tggtatttat 
taccatgaac 
acgagcatgt 
tacacagaca 
tgatgccttt 
tgtgtttaaa 
agttcgtgat 


tattaacatt 


aaaaattact 
gatcttttac 
aaagtggtca 
ggacatgttg 
gcgatgccta 
tatggtgaaa 
ctgtgtcaat 
tttggtgctg 
ccaactggca 
actttaattg 
gatatgtatg 
ttcacttatc 
aagataacag 
tggacagctt 
aactatcttg 
ttctggagga 
tttcctctta 
atgatttatt 
gtttcaagtg 
actctcacta 
aattacactc 
tcagacactc 
tttcatacta 
tttgctgcca 
aacaagtcac 
aactttgaat 
catactatga 
tcgcttgatg 
aataaagatg 
ctaccttctg 


acaaatttta 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 

1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1891 


10 


15 


20 


25 


30 


35 


40 


45 


50 


55 


<213> ARTIFICIAL SEQUENCE 


<220> 
<223> amorce N sens 


<400> 55 
cccatatgtc tgataatgga ccccaatcaa ac 


<210> 56 

<211> 32 

<212> DNA 

<213> artificial sequence 


<220> 
<223> amorce N antisens 


<400> 56 
cccccgggtg cctgagttga atcagcagaa gc 


<210> 57 

<211> 31 

<212> DNA 

<213> artificial sequence 


<220> 
<223> amorce Sc sens 


<400> 57 
cccatatgag tgaccttgac cggtgcacca c 


<210> 58 

<211> 30 

<212> DNA 

<213> artificial sequence 


<220> 
<223> amorce SL sens 


<400> 58 
cccatatgaa accttgcacc ccacctgctc 


<210> 59 

<211> 33 

<212> DNA 

<213> amorce Sc et SL antisens 


<400> 59 
cccccgggtt taatatattg ctcatatttt ccc 


<210> 60 

<211> 16 

<212> DNA 

<213> amorce sens série 1 


<400> 60 
ggcatcgtat gggttg 16 


<210> 61 
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32 


32 


31 


30 


33 
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10 


15 


20 


25 


30 


35 


40 


45 


50 


55 
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<211> 16 
<212> DNA 
<213> amorce antisens série 2 (28774-28759) 


<400> 61 
cagtttcacc acctcc 16 


<210> 62 

<211> 16 

<212> DNA 

<213> amorce sens série 2 (28375-28390) 


<400> 62 
ggctactacc gaagag 16 


<210> 63 

<211> 16 

<212> DNA 

<213> amorce antisens série 2 (28702-28687) 


<400> 63 
aattaccgcg actacg 16 


<210> 64 

<211> 26 

<212> DNA 

<213> sonde 1/série 1 (28561-28586) 


<400> 64 
ggcacccgca atcctaataa caatgc 26 


<210> 65 

<211> 21 

<212> DNA 

<213> sonde 2/série 1 (28588-28608) 


<400> 65 
gccaccgtgc tacaacttcc t 21 


<210> 66 

<211> 23 

<212> DNA 

<213> sonde 1/série 2 /sonde N/FL (28541-28563) 


<400> 66 
atacacccaa agaccacatt ggc 23 


<210> 67 

<211> 25 

<212> DNA 

<213> sonde 2/série 2/sonde SARS/N/LC705 (28565-28589) 


<400> 67 
cccgcaatcc taataacaat gctgc 25 


<210> 68 


<211> 30 
<212> DNA 


151 


20 


25 


30 


35 


40 


45 


50 


55 


EP 1 694 829 B1 


<213> artificial sequence 


<220> 
<223> amorce ancre 14T 


<400> 68 
agatgaattc ggtacctttt tttttttttt 30 


<210> 69 

<211> 13 

<212> PRT 

<213> artificial sequence 


<220> 
<223> peptide M2-14 


<400> 69 


a." Asp Asn Gly ue Ile Thr val Glu or Leu Lys Gln 


<210> 70 

<211> 12 

<212> PRT 

<213> artificial sequence 


<220> 
<223> peptide E1-12 


<400> 70 


= Tyr Ser Phe I Ser Glu Glu Thr sly Thr Leu 


<210> 71 

<211> 24 

<212> PRT 

<213> artificial sequence 


<220> 
<223> peptide E53-72 
<400> 71 


ive Pro Thr val per Val Tyr Ser Arg a Lys Asn Leu Asn ai Ser 


Glu Gly Val pre Asp Leu Leu Val 


<210> 72 
<211> 153 


152 


20 


25 


30 


35 


40 


45 


50 


55 


<212> DNA 


<213> CORONAVIRUS 


<400> 72 
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gatattaggt ttttacctac ccaggaaaag ccaaccaacc tcgatctctt gtagatctgt 


tctctaaacg aactttaaaa tctgtgtagc tgtcgctcgg ctgcatgcct agtgcaccta 


cgcagtataa acaataataa attttactgt cgt 


<210> 73 
<211> 410 
<212> DNA 


<213> CORONAVIRUS 


<400> 73 


ttctccagac 
acactcatga 
cgatacatag 
tagttaactt 
aaagagccac 
tgctagggag 
tatccccatg 


<210> 74 


<211> 4382 
<212> PRT 


aacttcaaaa 
tgaccacaca 
tctactcttg 
taatctcaca 
cacattttca 
agctgcctat 


tgattttaat 


<213> CORONAVIRUS 


<400> 74 


ttccatgagt 
aggcagatgg 
tgcagaatga 
tagcaatctt 
tcgaggccac 
atggaagagc 
agcttcttag 


ggagcttctg 
gctatgtaaa 
attctcgtaa 
taatcaatgt 
gcggagtacg 
cctaatgtgt 


gagaatgaca 


ctgattcaac 
cgttttcgca 
ctaaacagca 
gtaacattag 
atcgagggta 
aaaattaatt 


adaadadaad 


tcaggcataa 
attccgttta 
caagtaggtt 
ggaggacttg 
cagtgaataa 


ttagtagtgc 


Met Glu Ser Leu Val Leu Gly Val Asn Glu Lys Thr His Val Gln Leu 
1 5 10 a5 


Ser Leu Pro val Leu Gln Val Arg BoP val Leu val Arg o Phe Gly 


153 


60 
120 
153 


60 
120 
180 
240 
300 
360 
410 


20 


25 


30 


35 


40 


45 


50 


55 


Asp 


Gly 


Glu 


65 


His 


Tyr 


Glu 


Lys 


Leu 


145 


Trp 


Leu 


Pro 


Gly 


Lys 


Phe 


Ile 


Phe 


Glu 


ser 


Thr 


50 


Gin 


Gly 


Gly 


Thr 


Gly 


Gly 


Asn 


Asn 


Asp 


Lys 


210 


Arg 


Thr 


Lys 


val 


Lys 
290 


val 


35 


cys 


Pro 


His 


Arg 


Pro 


115 


Ala 


Asp 


Thr 


Gly 


Gly 


ser 


Gly 


Glu 


ser 


Phe 


275 


Lys 


Glu 


Gly 


Tyr 


Lys 


ser 


100 


Ile 


Gly 


Glu 


Lys 


Gly 


Tyr 


Met 


val 


Arg 


Ala 


260 


Pro 


Lys 


Glu 


Leu 


val 


val 


85 


Gly 


Ala 


Gly 


Leu 


His 


165 


Ala 


Pro 


cys 


Tyr 


ser 


245 


Lys 


Leu 


Thr 


Ala 


Val 


Phe 


70 


Val 


Ile 


Tyr 


His 


Gly 


Gly 


val 


Leu 


Thr 


cys 


230 


Asp 


Lys 


Asn 


Glu 
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Leu 


Glu 


55 


Ile 


Glu 


Thr 


Arg 


ser 


135 


Thr 


ser 


Thr 


Asp 


Leu 


215 


cys 


Lys 


Phe 


ser 


Gly 


Ser Glu Ala 
40 


Leu 


Lys 


Leu 


Leu 


Asn 


120 


Tyr 


Asp 


Gly 


Arg 


cys 


ser 


Arg 


ser 


Asp 


Lys 


Phe 


Glu 


Arg 


Val 


Gly 


val 


Gly 


Pro 


Ala 


Tyr 


185 


Tle 


Glu 


Asp 


Tyr 


Thr 


265 


Val 


Met 


154 


Lys 


ser 


Ala 


90 


val 


Leu 


Ile 


Ile 


Leu 


170 


val 


Lys 


Gln 


His 


Glu 


250 


Phe 


Lys 


Gly 


Arg 


Gly 


Asp 


75 


Glu 


Leu 


Leu 


Asp 


Glu 


155 


Arg 


Asp 


Asp 


Leu 


Glu 


235 


His 


Lys 


val 


Arg 


Glu 


val 


60 


Ala 


Met 


val 


Arg 


Leu 


140 


ASp 


Glu 


Asn 


Phe 


Asp 


220 


His 


Gin 


Gly 


Ile 


Ile 
300 


His 


45 


Leu 


Leu 


Asp 


Pro 


Lys 


Lys 


Tyr 


Leu 


Asn 


Leu 


205 


Tyr 


Glu 


Thr 


Glu 


Gin 


285 


Arg 


Leu 


Pro 


ser 


Gly 


His 


110 


Asn 


ser 


Glu 


Thr 


Phe 


190 


Ala 


Ile 


Tle 


Pro 


cys 


Pro 


ser 


Lys 


Gln 


Thr 
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Leu 


Leu 


Ala 


Ala 


val 


Glu 


Ala 


Asp 


Thr 


Asn 


Thr 


Tyr 


“Leu 


Gln 


Pro 


Gin 


Ala 


Ala 


Leu 


ser 


Gln 


Val 


Phe 


Asp 


Lys 


Met 


Asn 


Thr 


Lys 


Trp 


Leu 


Leu 


Asn 


Ala 


Tyr 


ser 


Glu 


Glu 


Leu 


ASp 


Gin 


Arg 


Leu 


Ala 


Ala 


Asn 


Glu 


ser 


Ile 


Asn 


Gly 


Tyr 


Asp 
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Phe 
3925 
Ala 


3940 


Lys 
3955 


Arg 
3970 


Ala 
3985 


Ala 
4000 


Arg 
4015 


Arg 
4030 


Ala 
4045 


Thr 
4060 


tle 
4075 


Glu 
4090 


Val 
4105 


Glu 
4120 


Thr 
4135 


Asn 
4150 
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4165 


Ser 


Tyr 


Lys 


Asp 


Met 


Lys 


Lys 


Asp 


Lys 


cys 


Gln 


Ile 


Thr 


Leu 


Thr 


Asn 


Gln 
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ser 
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Leu 


Ala 
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Leu 
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Leu 
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Asn 
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ser 


GIn 


ser 


Asp 


Leu 


Gln 


Lys 


Ala 


Gln 


Thr 


Asp 


cys 


Met 
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val 


Met 


Leu 


Pro 


Thr 


Lys 


Leu 


Pro 


Ala 


Lys 


Met 


Met 


ser 


Asn 


Val 


Val 


Asn 


val 


ASp 


Arg 


Val 


Ala 


Gly 


Lys 


ser 
3930 


Val 
3945 


ser 
3960 


Gin 
3975 


Tyr 
3990 


Ala 
4005 


Asp 
4020 


Pro 
4035 


val 
4050 


Thr 
4065 


Asp 
4080 


Asn 
4095 


Ala 
4110 


Ala 
4125 


cys 
4140 
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4 


Trp 
4170 


Tyr 


Ala 


Leu 


Arg 


Lys 


Met 


Ala 


Leu 
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Phe 


Ala 
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Asn 


Leu 


Thr 


Arg 


Ala 
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Asn 


Asn 


Lys 


Gln 


Gin 


Leu 
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Pro 


Thr 
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Arg 


Asp 


Phe 
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cys 
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Leu 
4205 


Leu 
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Thr 
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4250 


Gin 
4295 
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Pro 


Gly 


ser 


Asp 


Val 


Leu 


Gly 


Asp 
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GIn 
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Thr 
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Ile 


Asn 


ser 
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Gly Thr 
4180 


Asp. Thr 
4195 


Gly Leu 


4210 


Ala Thr 


4225 


Asn Ser 


4240 


Lys Ala 


4255 


Asn 


Cys 
4270 


Tle Thr 


4285 


Ala 


Asn Pro 


4315 


Pro Thr 


4330 


Thr val 


4345 


cys 
4360 


Asp 


Thr Phe 
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Pro 


Asn 


val 


Thr 


Tyr 


val 
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ser 


Lys 


Thr 


cys 


Gln 


Leu 


Tyr 


Lys 


Asn 


Arg 


Val 


Lys 


Lys 


Thr 


cys 


Gly 


cys 


Thr 


Leu 


Asn 


Thr 


Gly 


Leu 


Leu 


Leu 
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Met 


Pro 


cys 


Phe 
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val 


Arg 


Gly 


Glu 
4185 


Pro 
4200 


Asn 
4215 


Gin 
4230 


Ser 
4245 


Tyr 
4260 


Leu 
4275 


Glu 
4290 


Leu 
4305 


Cys 
4320 


Asn 
4335 


cys 
4350 


Glu 
4365 


Phe 
4380 


Leu 


Lys 


Arg 


Ala 


Phe 


Leu 


cys 


Ala 


Tyr 


Asp 


Asp 


Gly 


Pro 


Ala 


Glu 


Val 


Gly 


Gly 


cys 


Ala 


Thr 


Asn 


cys 


Leu 
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Met 
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Met 
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Met 


Arg 
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Val 
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Met 
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Arg 
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Thr 


val 


Arg 
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val 
val 
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Asp 
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val 
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val 
225 


Ala 


Tle 


val 


ser 


Ala 
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Lys 


ASp 


Thr 


cys 


130 


Asp 


Ile 


Leu 


Gly 


Phe 


210 


Asp 


Leu 


Lys 


cys 


Thr 


Gly 


35 


Asp 


Thr 


Asp 


Gly 


Met 


115 


Asp 


Tyr 


Leu 


Lys 


val 


195 


Gly 


ser 


Ala 


Trp 


Gly 


Asp 


20 


Phe 


Glu 


Met 


cys 


Asp 


100 


Ala 


Thr 


Phe 


Arg 


Thr 


180 


Leu 


Asp 


Tyr 


Ala 


Asp 
260 


val 
5 
val 
Ala 
Glu 
ser 
Pro 
85 
Met 
Asp 
Leu 
Asn 
val 
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val 
Thr 
Phe 
Tyr 
Glu 


245 


Leu 


ser 


val 


Lys 


Gly 


Asn 


70 
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val 


Leu 
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Lys 


Tyr 


Gln 


Leu 


Val 


ser 


230 


ser 


Leu 
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Ala Ala Arg Leu 
10 


Tyr 


Phe 


Asn 


55 


Tyr 


val 


Pro 


val 
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Lys 


Ala 


Phe 


Asp 


Gin 


215 


Leu 


His 


Lys 


Arg 


Leu 


40 


Leu 


Gln 


Ala 


His 


Tyr 


120 


Tle 


Asp 


Asn 


Cys 


Asn 


200 


val 


Leu 


Met 


Tyr 


Ala 


25 


Lys 


Leu 


His 


val 


Tle 


105 


Ala 


Leu 


Trp 


Leu 


ASp 


Gln 


Ala 


Met 


Asp 


ASp 
265 
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Phe 


Thr 


Asp 


Glu 


His 


90 


ser 


Leu 


val 


Tyr 


Gly 


Ala 


Asp 


Pro 


Pro 


Ala 


250 


Phe 


Thr 


Asp 


Asn 


ser 


Glu 


75 


Asp 


Arg 


Arg 


Thr 


Asp 


Glu 


Met 


Leu 


Gly 


Tle 


235 


Asp 


Thr 


pro Cys 
Ile Tyr 
cys Cys 
45 
Tyr Phe 
60 
Thr Ile 
Phe Phe 
GIn Arg 
His Phe 
125 


Tyr Asn 
140 

Phe val 
Arg Val 
Arg Asp 
Asn Gly 
cys Gly 
Leu Thr 


Leu Ala 


Glu Glu 


Gly 


Asn 


30 


Arg 


Val 


Tyr 


Lys 


Leu 


110 


Asp 


cys 


Glu 


Arg 


Ala 


190 


Asn 


val 


Leu 


Lys 


Arg 
270 


Thr 


15 


Glu 


Phe 


Val 


Asn 


Phe 


95 


Thr 


Glu 


cys 


Asn 


Gln 


175 


Gly 


Trp 


Pro 


Thr 


Pro 


255 


Leu 


Gly 
Lys 
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Leu 
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Pro 
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Ser 
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cys 
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Leu 


cys 
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Val 


Tyr 


His 


Pro 


Thr 


385 


val 


Lys 


Phe 


Tyr 


Glu 


465 


Ala 


Phe 


Glu 


Thr 


Phe 


Ile 


290 


Val 


Arg 


His 


ser 


Ala 


370 


cys 


Lys 


Gly 


Ala 


Asn 


450 


val 


Asn 


Asn 


Asp 


Ile 
530 


Asp 


275 


Asn 


Leu 


Lys 


Phe 


ser 


355 


Met 


Phe 


Pro 


Phe 


Gln 


435 


Leu 


val 


Gln 


Lys 


Gin 


515 


Thr 


Arg 


cys 


Phe 


Tle 


Arg 


340 


Arg 


His 


ser 


Gly 


Phe 


420 


Asp 


Pro 


Asp 


val 


Trp 


500 


Asp 


GIn 


Tyr 
Leu 
ser 
Phe 
325 
Glu 
Leu 
Ala 
Val 
Asn 
405 
Lys 
Gly 
Thr 
Lys 
Ile 
485 
Gly 
Ala 


Met 


Phe 


Asp 


Thr 


310 


Val 


Leu 


ser 


Ala 


Ala 


390 


Phe 


Glu 


Asn 


Met 


Tyr 


470 


Val 


Lys 


Leu 


Asn 
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Lys 


Asp 


295 


Val 


Asp 


Gly 


Phe 


ser 


375 


Ala 


Asn 


Gly 


Ala 


Cys 


Phe 


Asn 


Ala 


Phe 


Leu 
535 


Tyr Trp Asp 
280 


Arg 


Phe 


Gly 


val 


Lys 


Gly 


Leu 


Lys 


ser 


Ala 


440 


Asp 


Asp 


Asn 


Arg 


Ala 


520 


Lys 


172 


Cys 


Pro 


val 


val 


345 


Glu 


Asn 


Thr 


Asp 


ser 


425 


Ile 


Tle 


Cys 


Leu 


Leu 


505 


Tyr 


Tyr 


Tle 


Pro 


Pro 


330 


His 


Leu 


Leu 


Asn 


Phe 


410 


val 


ser 


Arg 


Tyr 


Asp 


490 


Tyr 


Thr 


Ala 


Gin 


Leu 


Thr 


315 


Phe 


Asn 


Leu 


Leu 


Asn 


395 


Tyr 


Glu 


Asp 


Gin 


Asp 


Lys 


Tyr 


Lys 


Ile 


Thr 


His 


300 


Ser 


Val 


Gin 


Val 


Leu 


380 


Val 


Asp 


Leu 


Tyr 


Leu 


460 


Gly 


ser 


Asp 


Arg 


ser 
540 


Tyr 


cys 


Phe 


Val 


Asp 


Tyr 


Asp 


Ala 


Phe 


Lys 


Asp 


Leu 


Gly 


Ala 


ser 


Asn 


525 


Ala 


Ala 


Gly 


ser 


val 


350 


Ala 


Lys 


Phe 


Ala 


His 


430 


Tyr 


Phe 


cys 


Gly 


Met 


510 


val 


Lys 


Pro 


Asn 


Pro 


Thr 


335 


Asn 


Ala 


Arg 


Gin 


val 


415 


Phe 


Tyr 


Val 


Tle 


Phe 


495 


ser 


Ile 


Asn 


Asn 


Phe 


Leu 


320 


Gly 


Leu 


Asp 


Thr 


Thr 


400 


ser 


Phe 


Arg 


val 


Asn 


480 


Pro 


Tyr 


Pro 


Arg 


20 


25 


30 


35 


40 


45 


50 


55 


Ala 


545 


Gln 


Thr 


Leu 


Asp 


Ala 


625 


His 


Met 


ser 


Gin 


Tyr 


Ala 


ser 


Met 


785 


His 


Arg 


Phe 


val 


Lys 


Tyr 


610 


ser 


Arg 


val 


Gly 


Ala 


690 


Tle 


Leu 


Ala 


Val 


Tle 


770 


ser 


Glu 


Thr 


His 


Val 


Thr 


595 


Pro 


Leu 


Phe 


Met 


Asp 


675 


val 


Ala 


Tyr 


Tyr 


val 


755 


LYS 


Glu 


Phe 


Val 


Gln 


Ile 


580 


Val 


Lys 


Val 


Tyr 


cys 


660 


Ala 


Thr 


Asp 


Arg 


Leu 


740 


cys 


Asn 


Ala 


cys 


Ala 


Lys 


Gly 


Tyr 


cys 


Leu 


Arg 


Gly 


Thr 


Ala 


Lys 


Asn 


725 


Arg 


Tyr 


Phe 


Lys 


ser 
805 


Gly 
550 
Leu 
Thr 
ser 
Asp 
Ala 
630 
Leu 
Gly 
Thr 
Asn 
Tyr 
710 
Arg 
Lys 
Asn 
Lys 
cys 


790 


Gin 
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Val 


Leu 


ser 


Asp 


Arg 


Arg 


Ala 


ser 


Ala 


val 


695 


val 


Asp 


His 


ser 


Ala 


775 


Trp 


His 


ser 


Lys 


Lys 


val 


600 


Ala 


Lys 


Asn 


Leu 


Tyr 


680 


Asn 


Arg 


Val 


Phe 


Asn 


760 


val 


Thr 


Thr 


173 


Tle 


ser 


Phe 


585 


Glu 


Met 


His 


Glu 


Tyr 


665 


Ala 


Ala 


Asn 


Asp 


ser 


745 


Tyr 


Leu 


Glu 


Met 


cys 


Tle 


570 


Tyr 


Thr 


Pro 


Asn 


cys 


650 


val 


Asn 


Leu 


Leu 


His 


730 


Met 


Ala 


Tyr 


Thr 


Leu 
810 


ser 


555 


Ala 


Gly 


Pro 


Asn 


Thr 


635 


Ala 


Lys 


ser 


Leu 


Gin 


715 


Glu 


Met 


Ala 


Tyr 


Asp 


val 


Thr 


Ala 


Gly 


His 


Met 


620 


cys 


Gln 


Pro 


val 


ser 


700 


His 


Phe 


Ile 


Gln 


Gln 


780 


Leu 


Lys 


Met 


Thr 


Trp 


Leu 


605 


Leu 


cys 


Val 


Gly 


Phe 


685 


Thr 


Arg 


Val 


Leu 


Gly 


Asn 


Thr 


Gln 


Thr 
Arg 
His 
590 
Met 
Arg 
Asn 
Leu 
Gly 
6 

Asn 
Asp 
Leu 
ASp 
Ser 
750 
Leu 
ASN 


Lys 


Gly 


Asn 


Gly 


Asn 


Gly 


Tle 


Leu 


ser 


655 


Thr 


Ile 


Gly 


Tyr 


Glu 


735 


Asp 


val 


Val 


Gly 


Asp 
815 


Arg 


560 


Ala 


Met 


Trp 


Met 


ser 


640 


Glu 


ser 


cys 


Asn 


Glu 


720 


Phe 


Asp 


Ala 


Phe 


Pro 


800 


Asp 


20 


25 
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Tyr 


Cys 


Arg 


Asn 


865 


Lys 


Met 


Glu 


val 


Arg 


945 


ser 


Gly 


Tyr 


Asn 


Asp 


Asn 


Lys 


Lys 


val 


Phe 


Phe 


850 


Gin 


Leu 


Leu 


Ala 


Leu 


930 


Pro 


His 


cys 


Tyr 


Tyr 


val 


835 


val 


Glu 


His 


Thr 


Met 


915 


cys 


Phe 


Lys 


Asp 


cys 
995 


Leu 


820 


Asp 


ser 


Tyr 


Asp 


Asn 


900 


Tyr 


Asn 


Leu 


Leu 


val 


980 


Lys 


Pro 


Asp 


Leu 


Ala 


Glu 


885 


Asp 


Thr 


ser 


cys 


val 


965 


Thr 


ser 


Tyr 


Ile 


Ala 


Asp 


870 


Leu 


Asn 


Pro 


Gin 


cys 


950 


Leu 


Asp 


His 


EP 1 694 829 B1 


Pro 


Val 


Tle 


855 


val 


Thr 


Thr 


His 


Thr 


935 


Lys 


ser 


val 


Asp 


Lys 


840 


Asp 


Phe 


Gly 


ser 


Thr 


920 


ser 


cys 


Val 


Thr 


Pro Ser Arg Ile 


825 


Thr 


Ala 


His 


His 


Arg 


val 


Leu 


cys 


Asn 


Gin 
985 


Asp 


Tyr 


Leu 


Met 


890 


Tyr 


Leu 


Arg 


Tyr 


Pro 


970 


Leu 


Gly 


Pro 


Tyr 


875 


Leu 


Trp 


Gin 


cys 


ASp 


955 


Tyr 


Tyr 


Thr 


Leu 


860 


Leu 


Asp 


Glu 


Ala 


Gly 


His 


val 


Leu 


Leu 


Leu 


845 


Thr 


Gln 


Met 


Pro 


val 


925 


Ala 


val 


cys 


Gly 


Gly 


Met 


Lys 


Tyr 


Tyr 


Glu 


910 


Gly 


cys 


Tle 


Asn 


Gly 
990 


Ala 


Ile 


His 


Tle 


ser 


895 


Phe 


Ala 


Ile 


ser 


Ala 


975 


Met 


Gly 


Glu 


Pro 


arg 


val 


Tyr 


cys 


Arg 


Thr 


960 


Pro 


ser 


Lys Pro Pro Ile Ser Phe Pro Leu Cys Ala 
1000 1005 


Gly Gln Val Phe Gly Leu Tyr Lys Asn Thr Cys”. val Gly Ser 
1010 1015 1020 


Asn 
1025 


Ala Gly Asp Tyr Ile 
1040: 


Leu 
105 


Leu 
1070 


Val Thr Asp Phe 


Phe Ala Ala Glu 


Ser Tyr Gly Ile 


Asn 
Li 
Leu 
1045 


Thr 
1060 


Ala Thr Val Arg Glu 
1075 


Ala Ile Ala Thr 


174 


Leu Lys Ala Thr 


Glu 
1065 


cys 
1035 


val 
1080 


Asp Trp Thr 

Ala Asn Thr cys Thr Glu Arg Leu 
1050 

Glu Thr Phe 


Leu Ser Asp 
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30 


35 
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Arg 


Leu 


ser 


Gly 


val 


ser 


Gly 


val 


Glin 


Ala 


His 


Pro 


val 


val 


val 


Asp 


Glu 
1085 


Asn 
1100 


Lys 
1115 


Asp 
1130 


Gly 
1 
Ala 


1160 


Leu 
1175 


Ala 
1190 


Leu 
1220 


Ala 
1235 


Ile 
1250 


cys 
1265 


Phe 
1280 


val 
1295 


val 
1310 


Pro 
1325 


Leu 


Arg 


Val 


Ala 


Asp 


Pro 


Tyr 


Asn 


Pro 


Tyr 


Ala 


ASp 


Phe 


Cys 


Phe 


Asn 


Ala 


His 


Asn 


GIn 


val 


Tyr 


Thr 


Pro 


Tyr 


Pro 


Tyr 


Val 


Lys 


Asp 


Thr 


Asp 


Ala 


Gin 


Leu 


Tyr 


Ile 


val 


Phe 


Leu 


Thr 


Gln 


Gly 


Pro 


Asp 


cys 


Lys 


Val 


Glu 


Arg 


Leu 


ser 


val 


Gly 


Tyr 


val 


val 


Leu 


Lys 


Thr 


ser 


Ala 


ser 


Phe 


Asn 


Ile 


Leu 


Pro 
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Trp 
1090 


Phe 
1105 


Glu 
1120 


Arg 
1135 


Leu 
1150 


Pro 
1165 


Asn 
1180 


Val 
1195 


Gly 
1210 


Ala 
1225 


Leu 
1240 


Arg 
1255 


Lys 
1270 


Ala 
1285 


ser 
1300 


Arg 
13415 


Ala 
1330 


Glu 


Thr 


Tyr 


Gly 


Thr 


Gln 


Ile 


Gly 


Lys 


Arg 


cys 


Ile 


val 


Leu 


Met 


Ala 


Pro 


175 


Val 


Gly 


Thr 


Thr 


ser 


Glu 


ser 


Met 


ser 


Ile 


Glu 


Tle 


Asn 


Pro 


Ala 


Lys 


Arg 


Gly 


Tyr 


Phe 


Thr 


His 


His 


Asp 


Gin 


His 


val 


Lys 


Pro 


ser 


Glu 


Thr 


His 


Thr 


Lys 


Arg 


Glu 


Thr 


Thr 


Tyr 


Glu 


Lys 


Phe 


Tyr 
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Thr 
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Tyr 


Leu 
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1200 
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Ala 
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Lys 


ser 
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ser 
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Pro 
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Val 


Gly 


Ala 


Lys 


ser 
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Lys 
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Lys 
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Lys 
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ser 
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Val 
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Gin 


Ile 
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Tle 


Phe 


EP 1 694 829 B1 


Phe 
1345 


Phe 
1360 


Val 
1375 
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Asn 


val 


Thr 


Leu 


Gln 


ser 


Leu 


Tyr 


Thr 


Tle 


Arg 


Ile 


Leu 


Val 


His 


Lys 


Met 


Tyr 


cys 


cys 


val 


cys 


Ser 


Thr 


Asn 


Gln 


Phe 


Phe 


Met 


Glu 


Thr 


Pro 


Thr 


Thr 


Gin 


Arg 
1365 


Tyr 
1380 


Phe 
1395 


Ala 
1410 


Arg 
1425 


Ser 
1440 


Thr 
1455 


Thr 
1470 


Asn 
1485 


ser 
1500 


Ile 
1515 


Thr 
1545 


Glu 
1560 


Tyr 
1575 


val 
1590 


Leu 


Arg 


Asp 


Lys 


Tle 


Asn 


Glin 


Val 


Gln 


val 


Asp 


Pro 


Leu 


Gin 


Gly 


Arg 


Asn 


Met 


cys 


Asn 


Met 


Asn 


Pro 


Asn 


Asp 


Thr 


Ala 


Arg 


Arg 


Phe 


Ala 


Leu 


Arg 


Gly 


Lys 


Pro 


Lys 


Phe 


Arg 


Ala 


Ala 


ser 


Thr 


Ile 


Asp 


Arg 


Lys 


Pro 


cys 


Leu 


Tyr 


20 


25 


30 


35 


40 


45 


50 


55 


Pro 


Ala 


val 


Asn 


Gln 


Asn 


Lys 


Phe 


Arg 


ser 


Tyr 


Gly 


Leu 


Glu 


Arg 


Asn 
1595 


Trp 
1610 


val 
1625 


Asn 
1640 


Thr 
1655 


Phe 
1670 


val 
1685 


Glu 
1715 


Thr 
1730 


ser 
1745 


val 
1760 


Gly 
1775 


Asn 
1790 


Ala 
1805 


Tyr 
1820 


LYS 
1835 


Met 


Tle 


Gly 


Leu 


Glu 


Lys 


val 


Leu 


Leu 


cys 


Asp 


Tyr 


Asn 


Ala 


Val 


Pro 


Val 


Phe 


Gly 


Thr 


val 


Phe 


His 


Arg 


ser 


Thr 


cys 


Thr 


Asn 


Leu 


His 


His 


Ile 


Gin 


Ile 


Phe 


Asn 


Ala 


Thr 


Leu 


Ile 


Asp 


ser 


Leu 


Tyr 


Pro 


Gin 


Val 


Glu 


Tle 


His 
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Thr Arg Glu Glu 
1600 


Asp Val 
1615 


Leu Pro 
1630 


Val Pro 
1645 


Arg Val 
1660 


Ile Pro 
1675 


Lys Ile 
1690 


Arg Val 
1705 


Met Lys 
1720 


cys Asp 
1735 


Ala cys 
1750 


Phe Met 
1765 


Ser Asn 
1780 


Ala ser 
1795 


cys Phe 
1810 


Gly Asp 
1825 


Met Val 
1840 


Glu 


Leu 


Thr 


Asn 


Leu 


val 


val 


Tyr 


Lys 


Trp 


Tle 


His 


Cys 


val 


Glu 


val 


177 


Gly 


Gin 


Gly 


Ala 


Met 


Gin 


Phe 


Phe 


Arg 


Asn 


Asp 


ASp 


ASD 


Lys 


Leu 


Lys 


Ala 


cys 


Leu 


Tyr 


Lys 


Tyr 


Met 


val 


Val 


Ala 


His 


val 


Gin 


Ala 


Arg 


Arg 


ser 


Tle 


His 


Gly 


val 


Pro 


Lys 


Leu 


Leu 


Lys 


Thr 


ser 


GIn 


His 


Tle 


val 


val 


Ala 


Arg 
1605 


Ala 
1620 


Phe 
1635 


Asp 
1650 


Pro 
1665 


ser 
1695 


Trp 
1710 


tle 
1725 


cys 
1740 


val 
1755 


Gln 
1770 


cys 
1785 


Met 
1800 


Asp 
1815 


Asn 
1830 


Leu 
1845 


His 


Thr 


ser 


Thr 


Pro 


Leu 


Asp 


Ala 


Gly 


Phe 


Gly 


Trp 


Gin 


Thr 


Trp 


ser 


Leu 


val 


Arg 


Thr 


Glu 


Gly 


Pro 


Thr 


His 


Pro 


ser 


Phe 


Gly 


val 


Arg 


ser 


Ala 


Ala 


Arg 


Asp 


Gly 


Asn 


Asp 


Trp 


Leu 


Gly 


Glu 


Thr 


Asp 


Phe 


His 


cys 


val 


cys 


Asp 
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Lys 


cys 


Pro 


Tyr 


Trp 


Arg 


Asp 


Ala 


Phe 


val 


Thr 


Glu 


Gly 


Trp 


Asn 


Pro 


Ile 


Phe 
1850 


val 
1865 


cys 
1880 


Ala 
1895 


Asn 
1910 


Phe 
1925 


Gly 
1940 


Phe 
1955 


Tyr 
1970 


Ser 
1985 


Arg 
2000 


Tyr 
2015 


Phe 
2030 


Asn 
2045 


val 
2060 


Val 
2075 


Asp 
2090 


Pro 


Pro 


ser 


Thr 


cys 


Asp 


Gly 


Asp 


Tyr 


Asp 


cys 


Arg 


ser 


Thr 


Val 


ser 


val 


Val Leu 


Gln Ala 


Asp Lys 


His His 


Asn Val 


Thr Arg 


Ser Leu 


Lys Ser 


Ser Asp 


Ile Asp 


Asn Leu 


Gin Tyr 


Leu Trp 


Phe Thr 


Asn Lys 


Ile ile 


Glu Ile 


His 


Glu 


Ala 


Asp 


Asp 


Val 


Tyr 


Ala 


ser 


Tyr 


Gly 


Leu 


Tle 


Arg 


Gly 


Asn 


Phe 


EP 1 694 829 B1 


Asp. Ile Gly 
1855 


val 
1870 


Tyr 
1885 
Lys 
1900 


Arg 
1915 


Leu 
1930 


val 
1945 


Phe 
1960 


Pro 
1975 


val 
1990 


Gly 
2005 


Asp 
2020 


Tyr 
2035 


Leu 
2050 


His 
2065 


Asn 
2080 


Glu 
2095 


Glu 


Lys 


Phe 


Tyr 


ser 


Asn 


Thr 


cys 


Pro 


Ala 


Ala 


Lys 


Gin 


Phe 


Ala 


Asn 


178 


Trp 


Ile 


Thr 


Pro 


Asn 


Lys 


Asn 


Glu 


Leu 


val 


Tyr 


Gln 


ser 


Asp 


val 


Lys 


Asn 


Lys 


Glu 


Asp 


Ala 


Leu 


His 


Leu 


ser 


Lys 


cys 


Asn 


Phe 


Leu 


Gly 


Tyr 


Thr 


Pro 


Phe 


Glu 


Gly 


Asn 


Asn 


Ala 


Lys 


His 


ser 


Arg 


Met 


Asp 


Glu 


His 


Thr 


Thr 


Lys 
1860 


Tyr 
1875 


Leu 
1890 


val 
1905 


Ala 
1920 


Leu 
1935 


Phe 
1950 


Gin 
1965 


Ala 
1995 


His 
2010 


Met 
2025 


Thr 
2040 


Asn 
2055 


Ala 
2070 


Lys 
2085 


Leu 
2100 


Ala 


Asp 


Phe 


cys 


Ile 


Pro 


His 


Leu 


Lys 


Thr 


His 


Ite 


Tyr 


Val 


Gly 


val 


Pro 


Ile 


Ala 


Tyr 


Leu 


val 


Gly 


Thr 


Pro 


Gin 


cys 


Ala 


ser 


Asn 


Ala 


Glu 


ASp 


val 


Lys 


Gln 


ser 


Phe 


cys 


cys 


Pro 


Phe 


val 


tle 


Asn 


Ala 


Leu 


Tyr 


Ala 


Gly 


Asn 
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Val 


Glu 


Thr 


Thr 


Tle 


Ala 


Lys 


Phe 


Met 


Glu 


Leu 


Leu 


Tyr 


ser 


Ala 
2105 


Ile 
2120 


val 
2135 


Ile 
2150 


ser 
2165 


Thr 
2195 


Gln 
2210 


Thr 
2225 


Leu 
2240 


Lys 
2255 


ASp 
2270 


His 
2285 


His 
2300 


Lys 
2315 


Phe 
2330 


val 
2345 


Phe 


Lys 


Ile 


Gly 


Ala 


Gln 


Glu 


Ala 


Gin 


Pro 


Pro 


Glu 


Ile 


Leu 


Leu 


Ile 


Ile 


Glu 


Ile 


Trp 


val 


cys 


Val 


Gly 


ser 


Phe 


Glu 


Arg 


Phe 


val 


Met 


Glu 


Thr 


Asp 


Leu 


Leu 


Asp 


cys 


ser 


Asp 


ser 


val 


Asn 


Thr 


Ser 


Ile 


Tyr 


Ile 


Asp 


Asp 


Leu 


Trp 


Asn 


Tyr 


Thr 


ser 


Leu 


Val 


Asn 


Tyr 


tyr 


Gin 


Gin 


Gly 


Gly 


Phe 


Ala 


Leu 
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Ala 
2110 


Asn 
2125 


Lys 
2140 


Met 
2155 


Leu 
2170 


Phe 
2185 


Lys 
2200 


Phe 
2230 


Phe 
2245 


Met 
2260 


Arg 
2275 


Asp 
2290 


Leu 
2305 


Tle 
2320 


Glin 
2335 


Leu 
2350 


Lys 


Leu 


Arg 


Thr 


Thr 


Arg 


Gly 


val 


Lys 


Thr 


Glu 


Tyr 


Phe 


Ala 


Pro 


Thr 


Asp 


179 


Arg 


Gly 


Glu 


Asp 


val 


Asn 


Leu 


Thr 


Lys 


Gln 


Thr 


Lys 


ser 


Lys 


Met 


Gly 


Asp 


Asn 


val 


Ala 


Ile 


Leu 


Ala 


Thr 


Leu 


Val 


ser 


Asp 


Leu 


His 


Arg 


Asp 


ser 


Phe 


Ile 


Asp 


Pro 


Ala 


Phe 


Arg 


Pro 


Ile 


Asp 


Arg 


Phe 


Glu 


Gly 


ser 


ser 


ser 


Val 


Lys 
2115 


Tle 
2130 


Ala 
2145 


Lys 
2160 


Asp 
2175 


Asn 
2190 


Ser 
2205 


Asp 
2250 


Leu 


2265 


Gin 
2295 


Gin 
2310 


Thr 
2325 


Lys 
2340 


Glu 
2355 


Pro 


Ala 


His 


Lys 


Gly 


Gly 


Lys 


Glu 


Ile 


Leu 


Glu 


Tyr 


Leu 


Asp 


val 


cys 


Ile 


Val 


Ala 


Val 


Pro 


Arg 


val 


Gly 


ser 


Ile 


Glu 


Leu 


Ala 


Gly 


ser 


Lys 


val 


Tle 


Pro 


Asn 


ser 


Thr 


val 


Leu 


Pro 


val 


GIn 


Asp 


Ala 


Phe 


Gly 


Pro 


Asn 


cys 


Lys 
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Ser 


Asp 


val 


Pro 


Leu 


Pro 


Gin 


val 


Thr 


Asp 


Tle 


Ile 


Glu 


Ile 


Thr 


Phe 


ser 


Gin 
2360 


Tyr 
2375 


Glu 
2390 


Gly 
2405 


Glu 
2420 


Lys 
2435 


Tyr 
2450 


Ile 
2465 


Ala 
2480 


ser 
2495 


Gly 
2510 


Ile 
2525 


Asn 
2540 


Lys 
2555 


Glu 
2570 


ser 
2585 


Glu 
2600 


Asp 


Ala 


Thr 


Val 


Lys 


Gly 


Leu 


His 


val 


Asp 


ASp 


ser 


ASD 


Gln 


His 


Trp 


Ala 


Leu 


Glu 


Phe 


Ala 


cys 


Tle 


Asn 


Phe 


Leu 


Leu 


cys 


Asp 


ser 


Lys 


ser 


Trp 


Phe 


ser 


Tle 


Tyr 


Met 


Asp 


Met 


Thr 


Gly 


Arg 


Asn 


Ala 


Met 


Lys 


Leu 


Trp 


Thr 


Leu 
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Val Ile 
2365 
Ser Phe 


2380 


Pro Lys 
2395 


Pro Asn 
2410 


Leu GIn 
2425 


Met Asn 
2440 


Leu Thr 
2455 


Ala Gly 


Gin Trp 
2485 


Asp Phe 
2500 


Thr val 
2515 


Tyr Asp 
Glu G 

2 
Ala Leu 


Asn Ala 
2575 


Ala Phe 
2590 


Tle Gly 


Ser 


Met 


Leu 


Leu 


Asn 


val 


Leu 


ser 


Leu 


Val 


His 


Pro 


Phe 


Gly 


Asp 


Val 


Ala 


180 


Lys 


Leu 


Gin 


Tyr 


Tyr 


Ala 


Ala 


Asp 


Pro 


ser 


Thr 


Arg 


Phe 


Gly 


Leu 


Thr 


Asn 


val 


Trp 


Ala 


Lys 


Gly 


Lys 


Val 


Lys 


Thr 


ASp 


Ala 


Thr 


Thr 


ser 


Tyr 


Asn 


Tyr 


val 


cys 


ser 


Met 


Glu 


Tyr 


Pro 


Gly 


Gly 


Ala 


Asn 


Lys 


Tyr 


Ile 


Lys 


Val 


Leu 


Lys 
2370 


Lys 
2385 


Gln 
2400 


Gin 
2415 


Asn 
2430 


Thr 
2445 


Tyr 
2460 


Val 
2475 


Thr 
2490 


Asp 
2505 


Lys 
2520 


His 
2535 


Leu 
2550 


Ala 
2565 


Leu 
2580 


Asn 
2595 


Gly 
2610 


Val 


Asp 


Ala 


Arg 


Ala 


Glin 


Asn 


Ala 


Leu 


ser 


Trp 


val 


cys 


val 


Met 


Ala 


Lys 


Thr 


Gly 


Trp 


Met 


val 


Leu 


Met 


Pro 


Leu 


Thr 


Asp 


Thr 


Gly 


Lys 


Gly 


ser 


Pro 


Tle 


His 


Gin 


Leu 


Ile 


cys 


Arg 


Gly 


val 


Leu 


Leu 


Lys 


Phe 


Ile 


His 


ser 


Lys 
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Glu Gin Ile Asp Gly Tyr Thr Met His 
2620 


2615 


Arg Asn_ Thr Asn Pro Ile Gin_ Leu Ser 


2630 2635 


Met ser Lys Phe Pro Leu Lys” Leu Arg 
2650 


2645 


Leu Lys Glu Asn Gin Ile Asn Asp Met 
2660 2665 


Lys Gly Arg Leu Ile Ile Arg Glu Asn 
2680 


2675 


Ser Asp Ile Leu Val Asn Asn 
2690 2695 


<210> 76 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L3/+/4932 


<400> 76 20 
ccacacacag cttgtggata 20 


<210> 77 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L4/+/6401 


<400> 77 20 
ccgaagttgt aggcaatgtc 20 


<210> 78 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L4/+/6964 


<400> 78 
tttggtgctc cttcttattg 20 


<210> 79 


<211> 20 
<212> DNA 


181 


Ala Asn 


Ser Tyr 


Gly Thr 


Ile Tyr 


Asn Arg 


Tyr 
2625 


ser 
2640 


Ala 
2655 


ser 
2670 


val 
2685 


Ile Phe Trp 


Leu Phe Asp 


Val Met Ser 


Leu Leu Glu 


val Val Ser 
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<213> Artificial sequence 


<220> 
<223> amorce S/L4/-/6817 


<400> 79 
ccggcatcca aacataattt 20 


<210> 80 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L5/-/7633 


<400> 80 
tggtcagtag ggttgattgg 20 


<210> 81 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> S/L5/-/8127 


<400> 81 
catcctttgt gtcaacatcg 20 


<210> 82 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L5/-/8633 


<400> 82 
gtcacgagtg acaccatcct 20 


<210> 83 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L5/+/7839 


<400> 83 
atgcgacgag tctgcttcta 20 


<210> 84 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
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<223> amorce S/L5/+/8785 


<400> 84 
ttcatagtgc ctggcttacc 20 


<210> 85 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L5/+/8255 


<400> 85 
atctiggcgc atgtattgac 20 


<210> 86 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L6/-/9422 


<400> 86 
tgcattagca gcaacaacat 20 


<210> 87 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L6/-/9966 


<400> 87 
tctgcagaac agcagaagtg 20 


<210> 88 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L6/-/10542 


<400> 88 
cctgtgcagt ttgtctgtca 20 


<210> 89 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L6/+/10677 


<400> 89 
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ccttgtggca atgaagtaca 20 


<210> 90 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L6/+/10106 


<400> 90 
atgtcatttg cacagcagaa 20 


<210> 91 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L6/+/9571 


<400> 91 
cttcaatggt ttgccatgtt 20 


<210> 92 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L7/-/11271 


<400> 92 
tgcgagctgt catgagaata 20 


<210> 93 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L7/-/11801 


<400> 93 
aaccgagagc agtaccacag 20 


<210> 94 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L7/-/12383 


<400> 94 
tttggctgct gtagtcaatg 20 


<210> 95 


184 


10 


15 


20 


25 


30 


35 


40 


45 


50 


55 


EP 1 694 829 B1 


<211> 20 
<212> DNA 
<213> Artificial sequence 


<220> 
<223> amorce S/L7/+/12640 


<400> 95 
ctacgacaga tgtcctgtgc 20 


<210> 96 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L7/+/12088 


<400> 96 
gagcaggctg tagctaatgg 20 


<210> 97 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L7/+/11551 


<400> 97 
ttaggctatt gttgctgctg 20 


<210> 98 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L8/-/13160 


<400> 98 
cagacaacat gaagcaccac 20 


<210> 99 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L8/-/13704 


<400> 99 
cgctgacgtg atatatgtgg 20 


<210> 100 

<211> 20 

<212> DNA 

<213> Artificial sequence 
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<220> 
<223> amorce S/L8/-/14284 


<400> 100 
tgcacaatga aggatacacc 20 


<210> 101 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L8/+/14453 


<400> 101 
acatagctcg cgtctcagtt 20 


<210> 102 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L8/+/13968 


<400> 102 
ggcattgtag gcgtactgac 20 


<210> 103 

<211>19 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L8/+/13401 


<400> 103 
gtttgcggtg taagtgcag 19 


<210> 104 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L9/-/15098 


<400> 104 
tagtggcggc tattgacttc 20 


<210> 105 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L9/-/15677 
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<400> 105 
ctaaaccttg agccgcatag 20 


<210> 106 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L9/-/16247 


<400> 106 
catggtcata gcagcacttg 20 


<210> 107 

<211> 21 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L9/+/16323 


<400> 107 
ccaggttgtg atgtcactga t 21 


<210> 108 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L9/+/15858 


<400> 108 
ccttacccag atccatcaag 20 


<210> 109 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L9/+/15288 


<400> 109 
cgcaaacata acacttgctg 20 


<210> 110 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L10/-/16914 


<400> 110 
agtgttgggt acaagccagt 20 
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<210> 111 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L10/-/17466 


<400> 111 
gttccaagga acatgtctgg 20 


<210> 112 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L10/-/18022 


<400> 112 
aggtgcctgt gtaggatgaa 20 


<210> 113 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L10/+/18245 


<400> 113 
gggctgtcat gcaactagag 20 


<210> 114 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L10/+/17663 


<400> 114 
tcttacacgc aatcctgctt 20 


<210> 115 

<211> 20 

<212> DNA 

<213> Artificiel sequence 


<220> 
<223> amorce S/L10/+/17061 


<400> 115 
tacccatctg ctcgcatagt 20 


<210> 116 


<211> 20 
<212> DNA 
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<213> Artificial sequence 


<220> 
<223> amorce S/L11/-/18877 


<400> 116 
gcaagcagaa ttaaccctca 20 


<210> 117 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L11/-/19396 


<400> 117 
agcaccacct aaattgcatc 20 


<210> 118 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L11/-/20002 


<400> 118 
tggtcccttt gaaggigtta 20 


<210> 119 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L11/+/20245 


<400> 119 
tcgaacacat cgtttatgga 20 


<210> 120 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce S/L11/+/19611 


<400> 120 
gaagcacctg tttccatcat 20 


<210> 121 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
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<223> amorce S/L11/+/19021 


<400> 121 
acgatgctca gccatgtagt 20 


<210> 122 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L1/F3/+/800 


<400> 122 
gaggtgcagt cactcgctat 20 


<210> 123 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L1/F4/+/1391 


<400> 123 
cagagattgg acctgagcat 20 


<210> 124 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L1/F5/+/1925 


<400> 124 
cagcaaacca Ctcaattcct 20 


<210> 125 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L1/R3/-/1674 


<400> 125 
aaatgatggc aacctctica 20 


<210> 126 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L1/R4/-/1107 


<400> 126 
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cacgtggttg aatgactttg 20 


<210> 127 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L1/R5/-/520 


<400> 127 
atttctgcaa ccagctcaac 20 


<210> 128 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L2/F3/+/2664 


<400> 128 
cgcattgtct cctggtttac 20 


<210> 129 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L2/F4/+/3232 


<400> 129 
gagattgagc cagaaccaga 20 


<210> 130 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L2/F5/+/3746 


<400> 130 
atgagcaggt tgtcatggat 20 


<210> 131 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L2/R3/-/3579 


<400> 131 
ctgccttaag aagctggatg 20 


<210> 132 
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<211> 20 
<212> DNA 
<213> Artificial sequence 


<220> 
<223> amorce SARS/L2/R4/-/2991 


<400> 132 
tttcttcacc agcatcatca 20 


<210> 133 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L2/R5/-/2529 


<400> 133 
caccgttctt gagaacaacc 20 


<210> 134 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L3/F3/+/4708 


<400> 134 
tctttggctg gctcttacag 20 


<210> 135 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SRAS/L3/F4/+/5305 


<400> 135 
gctggtgatg ctgctaactt 20 


<210> 136 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L3/F5/+/5822 


<400> 136 
ccatcaagcc tgtgtcgtat 20 


<210> 137 

<211> 20 

<212> DNA 

<213> Artificial sequence 
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<220> 
<223> amorce SARS/L3/R3/-/5610 


<400> 137 
caggtggtgc agacatcata 20 


<210> 138 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L3/R4/-/4988 


<400> 138 
aacatcagca ccatccaagt 20 


<210> 139 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce SARS/L3/R5/-/4437 


<400> 139 
atcggacacc atagtcaacg 20 


<210> 140 
<211> 7788 


<212> DNA 
<213> Artificial sequence 


<220> 
<223> géne S synthétique 


<400> 140 
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tcaatattgg 
ttggccattg 
aatatgaccg 
gtcattagtt 
gcctggctga 
agtaacgcca 
ccacttggca 
cggtaaatgg 
gcagtacatc 
caatgggcgt 
caatgggagt 
cgccccgttg 
tcgtttagtg 
tgctaacgca 
gtgaggcact 
actgggcttg 


ccattagcca 
catacgttgt 
ccatgttggc 
catagcccat 
ccgcccaacg 
atagggactt 
gtacatcaag 
cccgcctggc 
tacgtattag 
ggatagcggt 
ttgttttggc 
acgcaaatgg 
aaccgtcaga 
gtcagtgctt 
gggcaggtaa 


tcgagacaga 
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tattattcat 
atctatatca 
attgattatt 
atatggagtt 
acccccgccc 
tccattgacg 
tgtatcatat 
attatgccca 
tcatcgctat 
ttgactcacg 
accaaaatca 
gcggtaggcg 
tcactagaag 
ctgacacaac 
gtatcaaggt 
gaagactctt 


tggttatata 
taatatgtac 
gactagttat 
ccgcgttaca 
attgacgtca 
tcaatgggtg 
gccaagtccg 
gtacatgacc 
taccatggtg 
gggatttcca 
acgggacttt 
tgtacggtgg 
ctttattgcg 
agtctcgaac 
tacaagacag 


gcgtttctga 


194 


gcataaatca 
atttatattg 
taatagtaat 
taacttacgg 
ataatgacgt 
gagtatttac 
ccccctattg 
ttacgggact 
atgcggtttt 
agtctccacc 
ccaaaatgtc 
gaggtctata 
gtagtttatc 
ttaagctgca 
gtttaaggag 


taggcaccta 


atattggcta 
gctcatgtcc 
caattacggg 
taaatggccc 
atgttcccat 
ggtaaactgc 
acgtcaatga 
ttcctacttg 
ggcagtacac 
ccattgacgt 
gtaataaccc 
taagcagagc 
acagttaaat 
gaagttggtc 
accaatagaa 


ttggtcttac 


60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
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25 


30 
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tgacatccac 
aggctagagt 
gctgttcctg 
gcaggccccc 
gatctttcgg 
cgtgaccggc 
cggcatctac 
caccatgaac 
ccgggcctgc 
cacccagacc 
cgacgccttc 
cgtgttcaag 
ggtgagagac 
catcaacatc 
gggcaccagc 
gtacgacgag 
gctgaagtgc 
cagagtggtg 
cggcgaagtg 
cagcaactgc 
gtgctacggc 
cagcttcgtg 
cgccgactac 
ccggaacatc 
cggcaagctg 
gccctgcacc 
caccaccggc 
cgcccctgcc 
gaacttcaac 
ccageccttc 
Caagaccagc 
ccccggcacc 
cgtgagcacc 


gaacaacgtg 


tttgectttc 
acttaatacg 
accctgacca 
aactacaccc 
agcgacaccc 
ttccacacca 
ttcgccgcca 
aacaagagcc 
aacttcgagc 
cacaccatga 
agcctggacg 
aacaaggacg 
ctgcccagcg 
accaacttcc 
gccgccgcect 
aacggcacca 
agcgtgaaga 
cctagcggcg 
ttcaacgceca 
gtggccgact 
gtgagcgcca 
gtgaagggcg 
aactacaagc 
gacgccacaa 
cggcccttcg 
ccecectgccc 
atcggctatc 
accgtgtgcg 
ttcaacggcc 
cagcagttcg 
gagatcctgg 
aacgccagca 
gccatccacg 


ttccagaccc 
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tctccacagg 
actcactata 
gcggcagcga 
agcacaccag 
tgtacctgac 
tcaaccacac 
ccgagaagag 
agagcgtgat 
tgtgcgacaa 
tcttcgacaa 
tgagcgagaa 
gcttcctgta 
gcttcaacac 
gggccatcct 
acttcgtggg 
tcaccgacge 
gcttcgagat 
atgtggtgcg 
ccaagttcce 
acagcgtgct 
ccaagctgaa 
acgacgtgag 
tgcccgacga 
gcaccggcaa 
agcgggacat 
tgaactgcta 
agccctacag 
gccccaagct 
tgaccggcac 
gccgggatgt 
acatcagccc 
gcgaagtggc 
ccgaccagct 


aggccggctg 


tgtccactcc 
ggctagcgga 
cctggaccgg 
cagcatgcgg 
ccaggacctg 
cttcggcaac 
caacgtggtg 
catcatcaac 
cceccttcttc 
cgccttcaac 
gagcggcaac 
cgtgtacaag 
cctgaagecc 
gaccgccttt 
ctacctgaag 
cgtggactgc 
cgacaagggc 
gttccccaat 
cagcgtgtac 
gtacaactcc 
cgacctgtgc 
acagatcgcc 
cttcatgggc 
ctacaattac 
ctccaacgtg 
ctggcccctg 
agtggtggtg 
gagcaccgac 
cggcgtgctg 
gagcgacttc 
ctgcagcttc 
cgtgctgtac 
gacccccgcc 


cctgatcggc 


195 


cagttcaatt 
tccaccatgt 
tgcaccacct 
ggcgtgtact 
ttcctgccct 
cccgtgatcc 
cggggctggg 
aacagcacca 
gccgtgtcca 
tgcaccttcg 
ttcaagcacc 
ggctaccagc 
atcttcaage 
agccctgccc 
cctaccacct 
agccagaacc 
atctaccaga 
atcaccaacc 
gcctgggagc 
accttcttca 
ttcagcaacg 
cctggccaga 
tgcgtgctgg 
aagtaccgct 
cccttcagcec 
aacgactacg 
ctgagcttcg 
ctgatcaaga 
acccccagca 
accgacagcg 
ggcggcgtgt 
caggacgtga 
tggcggatct 


gccgagcacg 


acagctctta 
tcatcttcct 
tcgacgacgt 
accccgacga 
tctacagcaa 
ccttcaagga 
tgttcggcag 
acgtggtgat 
aacccatggg 
agtacatcag 
tgcgggagtt 
ccatcgacgt 
tgcccctggg 
aggacatctg 
tcatgctgaa 


ecctggccga 


ccagcaactt | 


tgtgcccctt 
ggaagaagat 
gcaccttcaa 
tgtacgccga 
ccggcgtgat 
cctggaacac 
acctgcggca 
ccgacggcaa 
gcttctacac 
agctgctgaa 
accagtgcgt 
gcaagcgctt 
tgcgggaccc 
ccgtgatcac 
actgcaccga 
acagcaccgg 


tggacaccag 


1020 
1080 
1140 
1200 
1260 
1320 
1380 
1440 
1500 
1560 
1620 
1680 
1740 
1800 
1860 
1920 
1980 
2040 
2100 
2160 
2220 
2280 
2340 
2400 
2460 
2520 
2580 
2640 
2700 
2760 
2820 
2880 
2940 
3000 


20 


25 


30 


35 


40 


45 


50 


55 


ctacgagtgc 
gctgcggagc 
cagcatcgcc 
caccgaagtg 
cggcgacagc 
gaaccgggcc 
ccaagtgaag 
tcagatcctg 
caacaaagtg 
catcaacgcc 
cctgctgacc 
cgccggctgg 
ctaccggttc 
cgccaaccag 
cgccctgggc 
gaagcagctg 
gctggacaaa 
cctgcagacc 
tctggccgcc 
cggcaaggge 
gcacgtgacc 
cgagggcaag 
catcacccag 
cggcaactgt 
cgagctggac 
cgtggacctg 
cgacagactg 
gggcaagtac 
cctgatcgcc 
cctgaaaggc 
cgtgctgaag 
tctagagtcg 
gacaaaccac 


ttgcetttatt 


gacatcccca 
accagccaga 
tacagcaaca 
atgcccgtga 
accgagtgcg 
ctgagcggca 
cagatgtata 
cccgaccctc 
accctggccg 
cgggacctga 
gacgacatga 
accttcggag 
aacggcatcg 
ttcaacaagg 
aagctgcagg 
agcagcaact 
gtggaggccg 
tacgtgaccc 
accaagatga 
tatcacctga 
tacgtgccta 
gcctacttcc 
cgcaacttct 
gatgtggtga 
agcttcaagg 
ggcgatatca 
aacgaagtgg 
gagcagtaca 
atcgtgatgg 
gcctgcagct 
ggcgtgaagc 
acccgggcgg 
aactagaatg 


tgtaaccatt 
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ttggcgccgg 
agtccatcgt 
acaccatcgc 
gcatggccaa 
ccaacctgct 
tcgccgccga 
agacccccac 
tgaagcccac 
acgccggctt 
tcetgcgccca 
tcgccgcecta 
ccggagccgc 
gcgtgaccca 
ccatcagcca 
acgtggtgaa 
teggcegcecat 
aagtgcagat 
agcagctgat 
gcgagtgcgt 
tgagcttccc 
gccaggagcg 
eccgggaggg 
tcagccccca 
tcggcatcat 
aggagctgga 
gcggcatcaa 
ccaagaacct 
tcaagtggcc 
tgaccatcct 
gtggcagctg 
tgcactacac 
ccgcttcgag 
cagtgaaaaa 


ataagctgca 


aatctgcgcc 
ggcctacacc 
catccccacc 
gacaagcgtg 
gctgcagtac 
gcaggaccgg 
cctgaagtac 
caagcgctcc 
tatgaagcag 
gaagtttaac 
tacagccgcc 
cctgcagatc 
gaacgtgctg 
gatccaggag 
ccagaacgcc 
cagctctgtg 
cgaccggctg 
cagagccgcc 
gctgggccag 
ccaggccgcc 
gaacttcacc 
cgtgttcgtg 
gatcatcacc 
caataacacc 
caaatacttc 
cgcctccgtg 
gaacgagagc 
ctggtacgtg 
gctgtgctgc 
ctgcaagttc 
ctgataactc 
cagacatgat 
aatgctttat 


ataaacaagt 


196 


agctaccaca 
atgagcctgg 
aacttcagca 
gattgcaaca 
ggcagcttct 
aacaccagag 
ttcgggggct 
ttcatcgagg 
tacggcgagt 
gggctgaccg 
ctggtgagcg 
cccttcgcca 
tacgagaacc 
agcctgacca 
caggccctga 
ctgaacgaca 
atcaccggac 
gagatccggg 
agcaagagag 
ccccacggcg 
accgccccag 
tttaacggca 
acagacaaca 
gtgtacgacc 
aagaaccaca 
gtgaacatcc 
ctgatcgacc 
tggctgggct 
atgaccagct 
gacgaggacg 
gagaattcac 
aagatacatt 
ttgtgaaatt 


Ttaacaacaac 


ccgtgagcct 
gcgccgacag 
tctccatcac 
tgtacatctg 
gcacccagct 
aagtgttcgc 
tcaacttctc 
acctgctgtt 
gcctgggcga 
tgctgccccc 
gcaccgccac 
tgcagatggc 
agaagcagat 
caaccagcac 
acaccctggt 
tcctgagcag 
gcctgcagtc 
ccagcgccaa 
tggacttctg 
tggtgttcct 
ccatctgcca 
ccagctggtt 
ccttcgtgtc 
ccctgcagcec 
cctcccccga 
agaaggagat 
tgcaggagct 
tcatcgccgg 
gctgtagctg 
acagcgagcc 
gcgtggtacc 
gatgagtttg 
tgtgatgcta 
aattgcattc 


3060 
3120 
3180 
3240 
3300 
3360 
3420 
3480 
3540 
3600 
3660 
3720 
3780 
3840 
3900 
3960 
4020 
4080 
4140 
4200 
4260 
4320 
4380 
4440 
4500 
4560 
4620 
4680 
4740 
4800 
4860 
4920 
4980 
5040 
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attttatgtt 
acaaatgtgg 
atcgcccttc 
attaagcgcg 
agcgcccgct 
tcaagctcta 
ccgcaaaaaa 
ttttcgccct 
aacaacactc 
ggcctattgg 
attaacgttt 
cacaccgcat 
cccgacaccc 
cttacagaca 
caccgaaacg 
tgataataat 
ctatttgttt 
gataaatgct 
cccttattcc 
tgaaagtaaa 
tcaacagcgg 
cttttaaagt 
tcggtcgccg 
agcatcttac 
ataacactgc 
ttttgcacaa 
aagccatacc 
gcaaactatt 
tggaggcgga 
ttgctgataa 
cagatggtaa 
atgaacgaaa 
cagaccaagt 


ggatctaggt 


tcaggttcag 
taaaatcgat 
ccaacagttg 
gcgggtgtgg 
cetttcgcett 
aatcgggggc 
cttgatttgg 
ttgacgttgg 
aaccctatct 
ttaaaaaatg 
acaatttcgc 
atggtgcact 
gccaacaccc 
agctgtgacc 
cgcgagacga 
ggtttcttag 
atttttctaa 
tcaataatat 
cttttttgceg 
agatgctgaa 
taagatcctt 
tctgctatgt 
catacactat 
ggatggcatg 
ggccaactta 
catgggggat 
aaacgacgag 
aactggcgaa 
taaagttgca 
atctggagcc 
gccctcccgt 
tagacagatc 
ttactcatat 


gaagatcctt 
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ggggagatgt 
aaggatccgg 
cgcagcctga 
tggttacgcg 
tcttcccttc 
tccctttagg 
gtgatggttc 
agtccacgtt 
cggtctattc 
agctgattta 
ctgatgcggt 
ctcagtacaa 
gctgacgcgc 
gtctccggga 
aagggcctcg 
acgtcaggtg 
atacattcaa 
tgaaaaagga 
gcattttgcec 
gatcagttgg 
gagagttttc 
ggcgcggtat 
tctcagaatg 
acagtaagag 
cttctgacaa 
catgtaactc 
cgtgacacca 
ctacttactc 
ggaccacttc 
ggtgagcgtg 
atcgtagtta 
gctgagatag 
atactttaga 
tttgataatc 


gggaggtttt 
gctggcgtaa 
atggcgaatg 
cagcgtgacc 
ctttctcgec 
gttccgattt 
acgtagtggg 
ctttaatagt 
ttttgattta 
acaaatattt 
attttctcct 
tctgctctga 
cctgacgggc 
gctgcatgtg 
tgatacgcct 
gcacttttcg 
atatgtatcc 
agagtatgag 
ttcctgtttt 
gtgcacgagt 
gccccgaaga 
tatcccgtat 
acttggttga 
aattatgcag 
cgatcggagg 
gccttgatcg 
cgatgcctgt 
tagcttcccg 
tgcgctcggc 
ggtctcgcgg 
tctacacgac 
gtgcectcact 
ttgatttaaa 


tcatgaccaa 


197 


ttaaagcaag 
tagcgaagag 
gacgcgccct 
gctacacttg 
acgttcgccg 
agagctttac 
ccategccct 
ggactcttgt 
taagggattt 
aacgcgaatt 
tacgcatctg 
tgccgcatag 
ttgtctgctc 
tcagaggttt 
atttttatag 
gggaaatgtg 
gctcatgaga 
tattcaacat 
tgctcaccca 
gggttacatc 
acgttttcca 
tgacgccggg 
gtactcacca 
tgctgccata 
accgaaggag 
ttgggaaccg 
agcaatggca 
gcaacaatta 
ccttccggct 
tatcattgca 
ggggagtcag 
gattaagcat 
acttcatttt 


aatcccttaa 


taaaacctct 
gcccgcaccg 
gtagcggcge 
ccagcgccct 
gctttccccg 
ggcacctcga 
gatagacggt 
tccaaactgg 
tgccgatttc 


ttaacaaaat 


tgcggtattt 


ttaagccagce 
ccggcatccg 
tcaccgtcat 
gttaatgtca 
cgcggaaccc 
caataaccct 
ttccgtgtcg 
gaaacgctgg 
gaactggatc 
atgatgagca 
caagagcaac 
gtcacagaaa 
accatgagtg 
ctaaccgctt 
gagctgaatg 
acaacgttgc 
atagactgga 
ggctggttta 
gcactggggc 
gcaactatgg 
tggtaactgt 
taatttaaaa 


cgtgagtttt 


5100 
5160 
5220 
5280 
5340 
5400 
5460 
5520 
5580 
5640 
5700 
5760 
5820 
5880 
5940 
6000 
6060 
6120 
6180 
6240 
6300 
6360 
6420 
6480 
6540 
6600 
6660 
6720 
6780 
6840 
6900 
6960 
7020 
7080 


20 
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30 


35 
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cgttccactg 
ttctgcgcgt 
tgccggatca 
taccaaatac 
caccgcctac 
agtcgtgtct 
gctgaacggg 
gatacctaca 
ggtatccggt 
acgcctggta 
tgtgatgctc 
ggttcctggc 


<210> 141 
<211> 23 
<212> DNA 


agcgtcagac 
aatctgctgc 
agagctacca 
tgtccttcta 
atacctcgct 
taccgggttg 
gggttcgtgc 
gcgtgagcta 
aagcggcagg 
tctttatagt 


gtcagggggg 
cttttgctgg 


<213> Artificial sequence 


<220> 


<223> amorce SNE-S1 


<400> 141 23 


ggttgggatt atccaaaatg tga 


<210> 142 
<211> 24 
<212> DNA 


<213> Artificial sequence 


<220> 


<223> amorce SNE-AS1 


<400> 142 24 


gcatcatcag aaagaatcat catg 


<210> 143 
<211> 21 
<212> DNA 


<213> Artificial sequence 


<220> 


<223> amorce SAR1-S 


<400> 143 


cctctcttgt tcttgctcgce a 21 


<210> 144 
<211> 21 
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cccgtagaaa 
ttgcaaacaa 
actctttttc 
gtgtagccgt 
ctgctaatcc 
gactcaagac 
acacagccca 
tgagaaagcg 
gtcggaacag 
cctgtcgggt 
cggagcctat 
ecttttgctc 


23 


24 


agatcaaagg 
aaaaaccacc 
cgaaggtaac 
agttaggcca 
tgttaccagt 
gatagttacc 
gcttggagcg 
ccacgcttcc 
gagagcgcac 
ttcgccacct 
ggaaaaacgc 


acatggctcg 


198 


atcttcttga 
gctaccagcg 
tggcttcagc 
ccacttcaag 
ggctgctgcc 
ggataaggcg 
aacgacctac 
cgaagggaga 
gagggagctt 
ctgacttgag 
cagcaacgcg 


acagatct 


gatccttttt 
gtggtttgtt 
agagcgcaga 
aactctgtag 
agtggcgata 
cagcggtcgg 
accgaactga 
aaggcggaca 
ccagggggaa 
cgtcgatttt 
gcctttttac 


7140 
7200 
7260 
7320 
7380 
7440 
7500 
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<212> DNA 
<213> Artificial sequence 


<220> 
<223> amorce SAR1-AS 


<400> 144 
tatagtgagc cgccacacat g 21 


<210> 145 

<211> 45 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 145 
ataggatcca ccatgtttat tttcttatta tttcttactc tcact 


<210> 146 

<211> 37 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 146 
atactcgagt tatgtgtaat gtaatttgac acccttg 


<210> 147 

<211> 45 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 147 
ataggatcca ccatgtttat tttcttatta tttcttactc tcact 


<210> 148 

<211> 36 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 148 
acctccggat ttaatatatt gctcatattt tcccaa 


<210> 149 

<211> 13 

<212> PRT 

<213> Artificial sequence 
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<220> 
<223> extrémité N-terminale de la protéine S du SRAS-CoV (acides amines 1 a 13) 


<400> 149 


Nia Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly 
10 


<210> 150 

<211> 10 

<212> PRT 

<213> Artificial sequence 


<220> 
<223> oligopeptide 


<400> 150 
Ser Gly Asp Tyr Lys Asp Asp Asp Asp Lys 
1- 5 10 
<210> 151 
<211> 34 
<212> DNA 


<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 151 
actagctagc ggatccacca tgttcatctt cctg 34 


<210> 152 

<211> 33 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 152 
agtatccgga cttgatgtac tgctcgtact tgc 33 


<210> 153 

<211> 59 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> oligonucléotide 


<400> 153 
tatgagcttt tttttttttt tttttttggc atataaatag actcggcgcg ccatctgca 59 


<210> 154 
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<211> 53 
<212> DNA 
<213> Artificial sequence 


<220> 
<223> oligonucléotide 


<400> 154 
gatggcgcgc cgagictatt tatatgccaa aaaaaaaaaa aaaaaaaagc tca 53 


<210> 155 

<211> 45 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 155 
atacgtacga ccatgtttat tttcttatta tttcttactc tcact 45 


<210> 156 

<211> 40 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 156 
atagcgcgct cattatgtgt aatgtaattt gacacccttg 40 


<210> 157 

<211> 20 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 157 
ccatttcaac aatttggccg 20 


<210> 158 

<211> 45 

<212> DNA 

<213> Artificial sequence 


<220> 
<223> amorce PCR 


<400> 158 
ataggatccg cgcgctcatt atttatcgtc gtcatcttta taatc 45 


Revendications 


1. 


Souche isolée ou purifiée de coronavirus humain associé au syndrome respiratoire aigu sévére, caractérisée en 
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ce que son génome présente sous la forme d’ADN complémentaire un codon sérine en position 23220-23222 du 
géne de la protéine S ou un codon glycine en position 25298-25300 du géne de |'ORF3, et un codon alanine en 
position 7918-7920 de ORF 1a ou un codon sérine en position 26857-26859 du géne de la protéine M, lesdites 
positions étant indiquées en référence a la sequence Genbank AY274119.3. 


2. Souche isolée ou purifiée de coronavirus selon la revendication 1, caractérisée en ce que |’équivalent ADN de 
son génome présente une séquence correspondant a la sequence SEQ ID NO: 1. 


3. Polynucléotide isolé ou purifié, caractérisé en ce que sa séquence est celle du génome de la souche isolée de 
coronavirus selon la revendication 1 ou la revendication 2. 
4. Polynucléotide isolé ou purifié selon la revendication 3, caractérisé en ce que sa séquence est la SEQ ID NO: 1. 


5. Fragment du polynucléotide selon la revendication 3, caractérisé en ce qu’il comprend les ou est constitué des 
bases ou paires de bases consécutives des positions 7919 a 23220, 7919 a 25298, 16622 a 23220, 19064 a 23220, 
16622 a 25298, 19064 a 25298, 23220 a 24872, 23220 a 26857, 24872 a 25298, ou 25298 a 26857. 


6. Réactif de détection d’un coronavirus associé au SRAS, caractérisé en ce qu’il est sélectionné dans le groupe 
constitué par une souche isolée de coronavirus selon la revendication 1 ou la revendication 2 et un polynucléotide 
selon lune quelconque des revendications 3, 4 et 5. 


7. Utilisation d’un produit sélectionné dans le groupe constitué par : 


(a) une souche isolée de coronavirus selon la revendication 1 ou la revendication 2, 
(b) un polynucléotide selon la revendication 3, la revendication 4 ou la revendication 5, 


pour la préparation d’un réactif de détection et éventuellement de génotypage d’un coronavirus associé au SRAS. 


8. Kit ou coffret de détection d’un coronavirus associé au SRAS, caractérisé en ce qu’il comprend au moins un réactif 
sélectionné dans le groupe constitué par : 


- une souche isolée de coronavirus selon la revendication 1 ou la revendication 2 et, 
- un polynucléotide selon la revendication 3, la revendication 4 ou la revendication 5. 


Claims 


1. Isolated or purified strain of human coronavirus associated with severe acute respiratory syndrome, characterised 
in that its genome exhibits, in the form of complementary DNA, a serine codon at position 23220-23222 of the gene 
for the S protein or a glycine codon at position 25298-25300 of the gene for ORF3, and an alanine codon at position 
7918-7920 for ORF 1a or a serine codon at position 26857-26859 of the gene for the M protein, said positions being 
indicated with reference to GenBank sequence AY274119.3. 


N 


Isolated or purified coronavirus strain according to Claim 1, characterised in that the DNA equivalent of its genome 
exhibits a sequence corresponding to sequence SEQ ID No. 1. 


3. Isolated or purified polynucleotide, characterised in that its sequence is that of the genome of the isolated coro- 
navirus strain according to Claim 1 or Claim 2. 


4. lsolated or purified polynucleotide according to Claim 3, characterised in that its sequence is SEQ ID No. 1. 
5. Fragment of the polynucleotide according to Claim 3, characterised in that it includes or is constituted by the 


consecutive bases or base pairs of positions 7919 to 23220, 7919 to 25298, 16622 to 23220, 19064 to 23220, 16622 
to 25298, 19064 to 25298, 23220 to 24872, 23220 to 26857, 24872 to 25298, or 25298 to 26857. 


> 


Reagent for detection of a coronavirus associated with SARS, characterised in that it is selected from the group 
constituted by an isolated coronavirus strain according to Claim 1 or Claim 2 and a polynucleotide according to any 
one of Claims 3, 4 and 5. 
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Use of a product selected from the group constituted by 


(a) an isolated coronavirus strain according to Claim 1 or Claim 2, 
(b) a polynucleotide according to Claim 3, Claim 4 or Claim 5, 


for the preparation of a detection reagent and possibly for genotyping of a coronavirus associated with SARS. 


Kit or box for detecting a coronavirus associated with SARS, characterised in that it includes at least one reagent 
selected from the group constituted by: 


- an isolated coronavirus strain according to Claim 1 or Claim 2 and, 
- a polynucleotide according to Claim 3, Claim 4 or Claim 5. 


Patentanspriiche 


1. 


Isolierter oder gereinigter humaner Coronavirusstamm, der mit dem Schweren Akuten Respiratorischen Syndrom 
assoziiert ist, dadurch gekennzeichnet, dass sein Genom in Form von komplementarer DNA an Position 
23220-23222 des Gens fur das S-Protein ein Serincodon oder an Position 25298-25300 des Gens fur den ORF3 
ein Glycincodon, und ein Alanincodon an Position 7918-7920 von ORF1a oder ein Serincodon an Position 
26857-26859 des Gens fur das M-Protein hat, wobei die Positionen in Bezug auf die Genbanksequenz AY274119.3 
angegeben sind. 


Isolierter oder gereinigter Coronavirusstamm nach Anspruch 1, dadurch gekennzeichnet, dass die DNA, die 
seinem Genom aquivalent ist, eine Sequenz hat, die der Sequenz SEQ ID NO:1 entspricht. 


Isoliertes oder gereinigtes Polynukleotid, dadurch gekennzeichnet, dass seine Sequenz jene des Genoms des 
isolierten Coronavirusstamms nach Anspruch 1 oder Anspruch 2 ist. 


Isoliertes oder gereinigtes Polynukleotid nach Anspruch 3, dadurch gekennzeichnet, dass seine Sequenz SEQ 
ID NO: 1 ist. 


Fragment des Polynukleotids nach Anspruch 3, dadurch gekennzeichnet, dass es die aufeinanderfolgenden 
Basen oder Basenpaare der Positionen 7919 bis 23220, 7919 bis 25298, 16622 bis 23220, 19064 bis 23220, 16622 
bis 25298, 19064 bis 25298, 23220 bis 24872, 23220 bis 26857, 24872 bis 25298 oder 25298 bis 26857 umfasst 
oder aus diesen besteht. 


Reagenz zum Nachweis eines mit SARS assoziierten Coronavirus, dadurch gekennzeichnet, dass es ausgewahlt 
ist aus der Gruppe bestehend aus einem isolierten Coronavirusstamm nach Anspruch 1 oder Anspruch 2 und einem 
Polynukleotid nach einem der Anspriche 3, 4 und 5. 


Verwendung eines Produktes ausgewahlt aus der Gruppe bestehend aus: 


(a) einem isolierten Coronavirusstamm nach Anspruch 1 oder Anspruch 2, 
(b) einem Polynukleotid nach Anspruch 3, Anspruch 4 oder Anspruch 5, 


zur Herstellung eines Reagenzes zum Nachweis und gegebenenfalls zur Genotypisierung eines mit SARS assozi- 
ierten Coronavirus. 


Kit oder Set zum Nachweis eines mit SARS assoziierten Coronavirus, dadurch gekennzeichnet, dass es wenig- 
stens ein Reagenz umfasst, ausgewahlt aus der Gruppe bestehend aus: 


- einem isolierten Coronavirusstamm nach Anspruch 1 oder Anspruch 2, und 
- einem Polynukleotid nach Anspruch 3, Anspruch 4 oder Anspruch 5. 
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FIGURE 7 
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A. B. 
SRAS-Cov m 10°77 m 1071 SRAS-Coyv mM 10°77 ™m. 1071 
— 220 220 - <}— 200 kDa 
— 130 130 — 
— 90 90 — 
— 70 70 —- 
55 kDa ——t - = 60 60 ~ 
— 40 40 — 
35 kDa —— 
. 30 - 
— 30 
A — 20 20 — 
2 LS. p.i. 
1S. p.i. 5 
anti-N ars 
FIGURE 8 
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FIGURE 9 
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FIGURE 10a 
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dilutions 





FIGURE 10b 


214 


EP 1 694 829 B1 





= 10710910910410910210! 1 T- = 
= "ARN synthétique N = = ARN synthétique N = 


FIGURE 11 
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>< XholII 
>< ScrFi >< Sau3Al 
>< Mval > < TthHBBI >< NdeII 
>< EcoRII > < TaqIi >< MELI 
>< Ecll361 >< Sau3Al >< Mbol 
>< Dsav >< Ndell >< Dpntitl 
>< Bstor >< MboI>< MnlI>< Dpnti 
>< BstNI >< Dpnit >< BstYI 
>< BsiLI >< DpnI >< BspAI 
>< BsaJl >< BspAL >< Bspl43I 
>< Apyl >< Bspl43I>< BglII 
ATATTAGGTT TTTACCTACC CAGGAAAAGC CAACCAACCT CGATCTCTTG TAGATCTGTT CTCTAAACGA 
10 20 30 40 50 60 70 
>< Vnel 
>< Sphi 
>< Snol 
>< Rmal 


>< Pael >< Sdul 

>< NspI >< Nspit 

>< NspHI >< HgiATI 

>< NlalIII >< Bsp1l2861 
>< MaeI >< Bmyl 


>< Tru9I >< ApaLI 
>< Msel >< BbvI >< Alw44I 
>< Dral >< Alul > < Fnu4HI >< Alw21T 
ACTTTAAAAT CTGTGTAGCT GTCGCTCGGC TGCATGCCTA GTGCACCTAC GCAGTATAAA CAATAATAAA 
80 90 100 110 120 130 140 
>< Sfcl 
>< PstI 
>< Mali 
>< Ksp6321 
>< HindIII > < MbolII >< Earl 
>< HincII >< MaelII >< Eaml1041I 
TTTTACTGTC GTTGACAAGA AACGAGTAAC TCGTCCCTCT TCTGCAGACT GCTTACGGTT TCGTCCGTGT 
150 160 170 180 190 200 210 
>< TthHBsi >< Styl 
>< TaqI >< Rmal >< ScrFI 
>< Sau3AlI >< Mael >< Neil 
>< NdeITI >< EcoTl4I >< MspI 
>< Mbol >< Ecol30I >< MaeIII 
>< DpnII >< BssTlI >< HpalIl 
>< Dpni >< BsaJI >< HapIt 
>< BspAI >< Blal >< Dsav 
>< Bsp143I >< AvrII >< Benl 
TGCAGTCGAT CATCAGCATA CCTAGGTTTC GTCCGGGTGT GACCGAAAGG TAAGATGGAG AGCCTTGTTC 
220 230 240 250 260 270 280 
>< Rmal 
>< Esp3I >< MaeII 
>< HindIII >< MaeII> < Eco57I >< BsmAI >< Mael 
>< HinclII > < AflIII > < Ddel >< Alw26I >< BsmBI 
TTGGTGTCAA CGAGAAAACA CACGTCCAAC TCAGTTTGCC TGTCCTTCAG GTTAGAGACG TGCTAGTGCG 
290 300 310 320 330 340 350 
FIGURE 13.1 
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>< Sau96l 
>< Pssi 

>< Pall 
>< NspIv 

>< Mall 

>< HaellII 
>< EcoOLlO9r 
>< DraII>< MboII 
>< Cfirl3I 

>< BsuRI > < MaeIlI 
>< BsiZI>< EcoNI >< Eco72I 
>< BshI >< BslI >< BsaAI 


>< PmLI 
>< MnlI >< PmaCI 

>< Ksp632I 
>< HinfI 


>< Earl 


>< PleI >< Eaml104I>< Asul >< BsiYI>< BbrPI >< MnlLI 
TGGCTTCGGG GACTCTGTGG AAGAGGCCCT ATCGGAGGCA CGTGAACACC TCAAAAATGG CACTTGTGGT 
360 370 380 390 400 410 420 
>< Tru9lI 
>< RsaI >< SfaNI 
>< RmaTl >< CspéI >< BspwWI >< Msel 
>< Maer >< Alul >< Afal >< Alul > < MaeII 


CTAGTAGAGC TGGAAAAAGG CGTACTGCCC CAGCTTGAAC AGCCCTATGT GTTCATTAAA CGTTCTGATG 


430 440 450 460 470 480 490 
>< Pall 
>< HaelIII >< Rsal 
>< Trugt >< Gdill McrI >< 
>< Msel >< Eael >< Csp6lr 
>< Esp4I >< BsuRI >< BsmI Bsif&I >< 
>< AfLII >< BshI >< Alul >< BscCI >< AfalI 
CCTTAAGCAC CAATCACGGC CACAAGGTCG TTGAGCTGGT TGCAGAAATG GACGGCATTC AGTACGGTCG 
500 510 520 530 540 550 560 
>< NspI 
>< Scal >< NspHI 
>< Rsal >< Nlalli 
> < Cspé6I >< BslI >< MboII 
>< BsrI >< BsiYI >< MbolIlI 
>< Acil >< Afal >< AFLIII >< Munl >< Acil 
TAGCGGTATA ACACTGGGAG TACTCGTGCC ACATGTGGGC GAAACCCCAA TTGCATACCG CAATGTTCTT 
570 580 590 600 610 620 630 
>< TthHB8Ii 
>< TagI 
>< Sau3AI 
>< NdeII 
>< MboI 
>< DpnIiIt 
> < DpniI 
>< Clal 
>< BsulSI 
>< BspDI 
>< Nlaiv >< BspAI 
>< MspI > < Bspl43I 
>< Hpall >< BsplO6I 
>< HapIt >< BsixI MaeIII > 
>< Cf£rlot >< BscI>< SfaNI Ddel >< 
>< BscBI >< Alul >< BanIIt BfrI >< 
CTTCGTAAGA ACGGTAATAA GGGAGCCGGT GGTCATAGCT ATGGCATCGA TCTAAAGTCT TATGACTTAG 
640 650 660 670 680 690 700 
FIGURE 13.2 
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>< Sau3AI 
>< NdeIT 
>< Mbol 
>< HphI VneI >< 
>< Dpnit Snor >< 
>< BspAI > < NlaIIL 
>< AlwI>< DpnI >< Ddel ApaLI >< 
>< Alul >< Bsp143I >< MboII >< BsrI Alw44I >< 
GTGACGAGCT TGGCACTGAT CCCATTGAAG ATTATGAACA AAACTGGAAC ACTAAGCATG GCAGTGGTGC 
710 720 730 740 750 760 770 
>< SstI 
>< Sdul 
>< SacI 
>< NspITt 
>< MnlI Sau96I >< 
>< HgiAl >< TthHBst PalI >< 
>< Sdul >< Eco241 >< TaqI NspIv >< 
>< NspIil >< Ecll36II > < Sall HaelIII >< 
>< HgiAlI >< Bsp12861 > < RtrI Cfrl3I >< 
>< DralIti >< Bmyl >< HindIII BsuRI >< 
>< Bsp1286I1 >< BanII >< HincII BsiZI >< 
>< BmyI >< Alw21I >< BsgI BshI >< 
>< Alw21I >< Alul >< MaeITI >< Accl Asul >< 
ACTCCGTGAA CTCACTCGTG AGCTCAATGG AGGTGCAGTC ACTCGCTATG TCGACAACAA TTTCTGTGGC 
780 790 800 810 820 830 840 
>< Thal 
>< Thal 
>< Muni 
>< Mvnt 
> < Rsal >< HinP1I 
> < Nlalv >< Hinél > < Vnel 
>< Kpni >< Hhal > < Snot 
>< Eco64l >< Cfol >< Sdul 
>< CspéI >< BstUl NspIT >< 
> < BscBI >< BstUI HgiAI >< 
>< Bant >< Bsp50I Bspl286I >< 
>< Asp718 >< Bsp50r >< BmyI 
> < Afal >< Acil > < ApaLt 
>< AccBil >< AccII > < Alw44I 
>< Acc65I >< MnilI >< SfaNI >< AcciI Alw21I >< 
CCAGATGGGT ACCCTCTTGA TTGCATCAAA GATTTTCTCG CACGCGCGGG CAAGTCAATG TGCACTCTTT 
850 860 870 880 890 900 910 
>< TthHBst 
>< TthHBst 
>< TaqI 
>< TaqI 
>< MnlI 
>< Ksp632I NlaIII >< 
>< HinfI>< Plef >< NlaLlIt 
>< Eam11041 >< MbolI >< MaeIIlL EcoRII >< 
>< Earl > < BbvI>< AccI >< Fnu4HI DsaV >< 
CCGAACAACT TGATTACATC GAGTCGAAGA GAGGTGTCTA CTGCTGCCGT GACCATGAGC ATGAAATTGC 
920 930 940 950 960 970 980 
>< TthHBst 
>< TaqI 
>< Sful 
>< NspV>< Tru9I 
>< ScrFI >< HinP1I >< LspI>< Msel. 
FIGURE 13.3 
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>< Mval >< Hin6I >< Sdul >< Csp45I 
>< Ecll361 >< Hhal >< NspI[I >< BstBI 
>< BstOr >< Haell >< HgiAl >< Bsp1l19I 
>< BstNI >< Eco47IIt >< Bspl286I >< BsiCcI 
>< Bsill >< Cfol >< Bmyl >< Bpuld4l 
>< ApylI >< DdeI >< Bspl43II >< Alul >< Alw21I >< Asull 
CTGGTTCACT GAGCGCTCTG ATAAGAGCTA CGAGCACCAG ACACCCTTCG AAATTAAGAG TGCCAAGAAA 
9390 1000 1010 1020 1030 1040 1050 
>< Trugl 
>< BsmI >< Msel 
>< BscCI > < Mall 
TTTGACACTT TCAAAGGGGA ATGCCCAAAG TTTGTGTTTC CTCTTAACTC AAAAGTCAAA GTCATTCAAC 
1060 1070 1080 1090 1100 1110 1120 
>< PmillI 
>< PmaCI 
>< MaelIl 
>< Eco72I 
>< BsaAl >< NiaIII >< Rsal 
>< BbrPTI >< Bst1l1lO7I >< Cspé6I 
>< AFLIII >< MnLI>< Odel >< Accl >< Afal 
CACGTGTTGA AAAGAAAAAG ACTGAGGGTT TCATGGGGCG TATACGCTCT GTGTACCCTG TTGCATCTCC 
1130 1140 1150 1160 1170 1180 1190 
>< SfaNI 
>< MaerIIt >< Accl NlalII >< 
ACAGGAGTGT AACAATATGC ACTTGTCTAC CTTGATGAAA TGTAATCATT GCGATGAAGT TTCATGGCAG 
1200 1210 1220 1230 1240 1250 1260 
>< SinI 
>< Saud96T 
PssI >< 
>< Psp5SIit 
>< PpuMI 
>< NspIv 
>< NspHITI 
>< Eco471I 
>< DrallI 
>< Cfr13I 
>< BsiZl 
>< Bmel8I 
>< AvalIl 
>< Asul 
>< Maell EcoOlO9I ><AflIII > 
ACGTGCGACT TTCTGAAAGC CACTTGTGAA CATTGTGGCA CTGAAAATTT AGTTATTGAA GGACCTACTA 
1270 1280 1290 1300 1310 1320 1330 
Van91lI >< 
SinI >< 
>< Rsal Sau96I >< 
>< Nspi P£IMI >< 
>< Nlalv NspIV >< 
>< NlaIII NspHII > 
>< NspHI>< KpnI Eco47I >< 
>< Eco6é4I Cfr1l3I >< 
>< Csp6I BslI >< 
>< BscBI BsiZI >< 
>< BanI BsiYI >< 
>< Asp718 Bmel8I >< 
>< Afal AvalII >< 
>< AccBlI AsuI >< 
FIGURE 13. 4 


220 


EP 1 694 829 B1 


>< Accé65I >< Sfcl >< NlaLliIt AccB7I >< 
CATGTGGGTA CCTACCTACT AATGCTGTAG TGAABATGCC ATGTCCTGCC TGTCAAGACC CAGAGATTGG 
1340 1350 1360 1370 1380 1390 5 1400 
>< TthHBBI 
>< TaqI>< MnlI 
>< HinfI 
>< Ddel >< PleI >< Acil 
ACCTGAGCAT AGTGTTGCAG ATTATCACAA CCACTCAAAC ATTGAAACTC GACTCCGCAA GGGAGGTAGG 
1410 1420 1430 1440 1450 1460 1470 
>< Rmal NlalV >< 
>< Mnll >< Bsrl 
>< Mael >< BbovI >< Fnud4HI BscBI >< 
ACTAGATGTT TTGGAGGCTG TGTGTTTGCC TATGTTGGCT GCTATAATAA GCGTGCCTAC TGGGTTCCTC 
1480 1490 1500. 1510 1520 1530 1540 
XholII >< 
Sau3Al >< 
NdeII >< 
M£1I >< 
>< MaelLlilI MboI >< 
>< Pall >< Eco31I OpnIT >< 
>< Haelil >< BsrI >< MnlI DpniI > 
>< Rmal >< BsuRI >< BsrI >< BsmAT BstYI >< 
>< Mnil > < Ddel >< BspWI >< BsaI>< HphI BspAI >< 
>< Mael >< BshI>< BglI >< Alw261I Bsp143I > 
GTGCTAGTGC TGATATTGGC TCAGGCCATA CTGGCATTAC TGGTGACAAT GTGGAGACCT TGAATGAGGA 
1550 1560 1570 1580 1590 1600 1610 
> < TrudI 
> < Msel 
>< MaelIl >< Tru9l 
>< Hpal > < MnilI 
>< HindII > < Ksp632I 
>< HinfI >< PleI >< HincII > < Earl 
>< AlwI >< Ddel >< AFLIIL >< Msel > < Eaml1041I 
TCTCCTTGAG ATACTGAGTC GTGAACGTGT TAACATTAAC ATTGTTGGCG ATTTTCATTT GAATGAAGAG 
1620 1630 1640 1650 1660 1670 1680 
>< MbolI PleI >< 
>< BstKI >< -Sfanit > < HinfI 
GTTGCCATCA TTTTGGCATC TTTCTCTGCT TCTACAAGTG CCTTTATTGA CACTATAAAG AGTCTTGATT 
1690 1700 1710 1720 1730 1740 1750 
>< Styl 
>< MaelIII 
>< EcoT14lt 
>< Plel >< Ecol30f 
>< MaelII >< BssTLI BslI >< 
>< HinfI>< Acil >< BsaJI BsiYI >< 
ACAAGTCTTT CAAAACCATT GTTGAGTCCT GCGGTAACTA TAAAGTTACC AAGGGAAAGC CCGTAAAAGG 
1760 1770 1780 1790 1800 1810 1820 
>< Sau3AI >< Van9LI 
>< NdeITI >< PEIMI 
>< Mbol _ >< DralIl 
>< Dpnit >< Bsll 
>< DpnI >< Trust >< BsiYI 
>< BspAI >< MselI >< BovI >< Malt 
>< Bspl43I >< AccB7I Enu4dHI >< 
FIGURE 135 
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TTTAACACCA CTGTGTGGTT TTCCCTCACA GGCTGCTGGT 


TGCTTGGAAC ATTGGACAAC AGAGATCAGT 
1830 1840 1850 1860 1870 1880 1890 
>< Thal 
>< SfaNI 
>< Mynt 
>< HinPll 
>< HinP1l 
>< Hin6éI 
>< Hinel 
>< Hhal 
>< Sau3AI >< Hhal 
>< NdeII >< Cfol Pvull > 
>< Mbol >< Cfol PspSI > 
>< Dpnilt >< BstUl NspBIT > 
>< Dont >< BssHITI Hphi >< 
>< BspAI >< Bsp5olI Fnu4HI >< 
>< Bsp143I >< AccII >< Fnu4HI >< BbovI AluI > 
GTTATCAGAT CAATTTTTGC GCGCACACTT GATGCAGCAA ACCACTCAAT TCCTGATTTG CAAAGAGCAG 
1900 1910 1920 1930 1940 1950 1960 
>< TthHBel 
>< Styl 
>< Ncol 
>< HindIII 
>< Hincli 
>< Hinll 
>< EcoTl4I 
>< Ecod7I 
>< TagI>< Ecol30f 
>< SalI >< Dsal 
>< RtrI >< BssT1I 
>< BsaHI 
>< BbillI>< NlaIII 
>< MaellII >< AcyI >< Hgal 
>< BbvI >< MaeII >< AccI>< BsaJI HphI >< 
CTGTCACCAT ACTTGATGGT ATTTCTGAAC AGTCATTACG TCTTGTCGAC GCCATGGTTT ATACTTCAGA 
1970 1980 1990 2000 2010 2020 2030 
>< Rsal 
>< Ndel > < Cspér 
>< BspMI >< MaelII >< Bsri >< Afal >< Ddel 
CCTGCTCACC AACAGTGTCA TTATTATGGC ATATGTAACT GGTGGTCTTG TACAACAGAC TTCTCAGTGG 
2040 2050 2060 2070 2080 2090 2100 
>< Stul 
>< Pall 
>< HaelIiI 
>< Ecol47I 
>< Sdul >< Ddel 
>< NspIit >< BsuRI 
>< Bspl2861 >< Bshl OdeI >< 
>< Bmyt >< Aatl > < Mnit BfrI >< 
TIGTCTAATC TTTTGGGCAC TACTGTTGAA AAACTCAGGC CTATCTTTGA ATGGATTGAG GCGAAACTTA 
2110 2120 2130 2140 2150 2160 2170 
>< TELT 
>< Hinft Tthll1li >< 
>< SfaNI >< BsgI >< Fok AspI >< 
GTGCAGGAGT TGAATTTCTC AAGGATGCTT GGGAGATTCT CAAATTTCTC ATTACAGGTG TTTTTGACAT 
2180 2190 2200 2210 2220 2230 2240 
FIGURE 13.6 
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Tru9l >< 
MseI >< 
Hpalt > 
HindII > 
>< EcoS7I1 HinclI > 
CGTCAAGGGT CAAATACAGG TTGCTTCAGA TAACATCAAG GATTGTGTAA AATGCTTCAT TGATGTTGTT 
2250 2260 2270 2280 2290 2300 2310 
>< Sau3Al 
>< NdeII 
>< Mbol 
> < MaellIl >< Sau3Al 
>< Fbhal >< NdeII 
>< Dpnil >< Dpnit 
>< Dpnti >< DpnIMboII >< 
>< BspAI >< HinP1I DdeI >< 
>< Bspl43I >< Hinét >< Bsp143I 
>< TthHBsI >< BsiQI >< Hhal >< MboIBfrI >< 
>< TaqI >< Bell >< Cfol >< BSpAT BbsI >< 
AACAAGGCAC TCGAAATGTG CATTGATCAA GTCACTATCG CTGGCGCAAA GTITGCGATCA CTCAACTTAG 
2320 2330 2340 2350 2360 2370 2380 
>< Pvull 
>< Maell >< Psp5SI 
>< BstllO7I >< NspBII 
>< BsaAI FEnu4HI >< 
>< BbovI > < Enu4HI 
>< HphI >< DrdI >< AccI >< Alul 
GTGAAGTCTT CATCGCTCAA AGCAAGGGAC TITACCGTCA GIGTATACGT GGCAAGGAGC AGCTGCAACT 
2390 2400 2410 2420 2430 2440 2450 
>< Tru9l 
>< NlalVv 
>< Msel 
>< MnLli 
>< Esp4I >< Scal 
>< Ecoé4l >< Rsal 
>< BscBI >< NlaIIIMnl!I >< 
>< NlaIII >< Banrt Mnl1I >< 
>< Af1II >< T£iT : >< Csp6éI 
>< BbvI >< AccBlI >< Maelll >< HinfI >< HphiI >< Afal 
ACTCATGCCT CTTAAGGCAC CAAAAGAAGT AACCTTTCTT GAAGGTGATT CACATGACAC AGTACTTACC 
2460 2470 2480 2490 2500 2510 2520 
> < Xhol 
>< TthHBst 
>< TthHB8Ii>< TaqI 
> < SlalI 
> < PaeR7I 
> < NspIiItr 
>< HphI >< HinlI 
> < Eco88sIi 
> < CerI 
>< Esp3I >< BsaHI 
> < Bcol 
>< BsmAI >< Bbill 
> < Aval >< Hgal 
>< TaqI > < Ama87I>< BsmBI 
>< DdeI>< MnilI >< Alw261I >< Acyl >< Alul 
TCTGAGGAGG TTGTTCTCAA GAACGGTGAA CTCGAAGCAC TCGAGACGCC CGTTGATAGC TTCACAAATG 
2530 2540 2550 2560 2570 2580 2590 


FIGURE 13. 7 
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>< Pall >< NlaItt 
>< HaelII >< MnliI 
>< BsuRI >< DdeI >< Tru9I 


>< Alul >< BsrI >< BshI >< BfrI >< MseI 
GAGCTATCGT TGGCACACCA GTCTGTGTAA ATGGCCTCAT GCTCTTAGAG ATTAAGGACA AAGAACAATA 
2600 2610 2620 2630 2640 2650 2660 
>< Vnel 
Tru9I >< 
>< ScrFI >< Snot 
>< Mval >< Sdul 
>< EcoRII >< NspII 
>< MstI >< Ecll36I MseI >< 
>< HinP1lI >< Dsav >< HgiAI 
>< Hino >< Bstol Bsp1286I ><BslI >< 
>< Hhal >< BstNI BsiYI >< 
>< FspI >< BsmAI >< Bmyl 
>< Fdill >< BsiLI. >< ApaLI 
>< Cfol >< ApyI >< Trust >< Alw44I 
>< Avill >< Alw26I >< BsrI >< MseT .>< Alw21I 
CTGCGCATTG TCTCCTGGTT TACTGGCTAC AAACAATGTC TTTCGCTTAA AAGGGGGTGC ACCAATTAAA 
2670 2680 2690 2700 2710 2720 2730 
>< TEL 
>< MaellII >< Mboll > < MaelIt? >< HinfI AlulI >< 
GGTGTAACCT TTGGAGAAGA TACTGTTTGG GAAGTTCAAG GTTACAAGAA TGTGAGAATC ACATTTGAGC 
2740 2750 2760 2770 2780 2790 2800 
>< Rsal 
>< NlaIv 
MaeIII >< 
>< MspI>< KpnI 
>< Hpail 
>< HapIt 
> < Ecoé4I 
>< Sdul >< CspéI 
>< NspIt >< T£iI >< BscBI 
>< HgiAL > < Bant 
>< Maell >< Bspl286I > < Asp718 
>< HindIiI >< BmylI >< HinflI >< Afal 
>< HincI1L >< Trugt " >< Alw21T > < AccBLI 
>< AFLIIT >< Msel >< Acct > < Acc65I 
TTGATGAACG TGTTGACAAA GTGCTTAATG AAAAGTGCTC TGTCTACACT GTTGAATCCG GTACCGAAGT 
2810 2820 2830 2840 2850 2860 2870 
>< Sau3AI 
>< Ndeil 
>< Mbol 
>< DpniIt 
. >< Nspi > < Dpnt 
>< NspHI >< MboII >< BspAI 
>< NlaIIl > < BsrI > < Bsp143I 
>< Ddel >< Mnlt >< AlwNI >< BosI >< AlwNI 
TACTGAGTTT GCATGTGTTG TAGCAGAGGC TGTTGTGAAG ACTTTACAAC CAGTTTCTGA TCTCCTTACC 
2880 2890 2900 2910 2920 2930 2940 
>< Sau3Al 
>< NdelIl 
>< Mbol 
>< DpniIl 
>< Dpnt 
>< BspAI 
FIGURE 138 
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>< NlaIif>< Bsp1431 >< Alul 
AACATGGGTA TTGATCTTGA TGAGTGGAGT GTAGCTACAT TCTACTTATT 


>< SfaNI 


TGATGATGCT GGTGAAGAAA 


2950 2960 2970 2980 2990 3000 3010 
>< S£faNI 
>< Mnoli 
>< MbolII >< Gsul >< Ksp632I >< MnlI 
>< BsaAI >< Earl > < MboIl 
>< HphI >< MaelI>< BpmI >< MnlI >< Eaml1041 >< MboITI 
ACTTTTCATC ACGTATGTAT TGTITCCTTTT ACCCTCCAGA TGAGGAAGAA GAGGACGATG CAGAGTGTGA 
3020 3030 3040 3050 3060 3070 3080 
> < Rsal 
>< Rsal 
>< NlalII 
>< MnLlI >< Fokr 
>< Csp6I Eco311I >< 
>< Cspé6I >< MamI BsmAI >< 
>< MboIlI > < Afal >< BsiBI Bsal >< 
>< MboII >< Afal >< BsaBIAlw26I >< 
GGAAGAAGAA ATTGATGAAA CCTGTGAACA TGAGTACGGT ACAGAGGATG ATTATCAAGG TCTCCCTCTG 
3090 3100 3110 3120 3130 3140 3150 
>< NlaIV>< PvulI>< XmnI 
>< Eco64I >< Psp5SI >< TthHB8I 
>< MnlI >< DdeI >< TagI >< MnlI >< MboITI 
>< BscBI>< NspBII >< Mnil >< Ksp632I >< MboII >< MboIT 
>< Bant >< Molt >< Earl >< BsxrI 
>< AccB1I >< AlulI >< Asp700I >< Eaml1104I >< MboII>< BbsI 


GAATTTGGTG CCTCAGCTGA AACAGTTCGA GTTGAGGAAG AAGAAGAGGA AGACTGGCTG GATGATACTA 


3160 3170 3180 3190 3200 3210 3220 
>< Tru9lt 
>< FokI >< Msel >< EcodS7I 
>< Ddel >< BsrI>< MboII BsrI >< 
CTGAGCAATC AGAGATTGAG CCAGAACCAG AACCTACACC TGAAGAACCA GTTAATCAGT TTACTGGTTA 
3230 3240 3250 3260 3270 3280 3290 
>< Trugt >< MnLI 
>< Msel >< Trudi >< Hindri>< Trudy >< DralIt 
>< Dral >< Msel >< HincII>< Msel >< BspWI 
TTTAAAACTT ACTGACAATG TTGCCATTAA ATGTGTTGAC ATCGTTAAGG AGGCACAAAG TGCTAATCCT 
3300 3310 3320 3330 3340 3350 3360 
>< Vnel 
>< Snol 
> < SduI 
> < NspIt 
> < HgiAI 
> < Bspl286L 
> < Bayl 
>< ApaLl 
>< Hphl > < Nlaltli >< Alw44T 
>< BbvI >< Fnu4kL >< BspMI > < Alw21I 
ATGGTGATTG TAAATGCTGC TAACATACAC CTGAAACATG GTGGTGGTGT AGCAGGTGCA CTCAACAAGG 
3370 3380 3390 3400 3410 3420 3430 
>< Sau96l 
>< Pall 
>< Nspiv 
>< HaelII 
>< Nlalv >< Cfrl3I 
FIGURE 13.9 
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>< Eco64I >< BsuRI 
>< BscBI > < TrudSl >< BsiZl 
>< BanI > < Msel >< BshI >< MnlI 


>< AccBlI>< NlalII >< Alul >< AsuI >< MnlI 
CAACCAATGG TGCCATGCAA AAGGAGAGTG ATGATTACAT TAAGCTAAAT GGCCCTCTTA CAGTAGGAGG 


3440 3450 3460 3470 3480 3490 3500 
>< Sint 
>< Saug961 
>< Nspiv 
>< NspHI>< NspHIT 
>< Eco471I 
>< Cfrl13I 
>< NlalIfi >< BspMI 
>< Bsial 
>< Bmel8I 
>< AvaII MnlI >< 
> < Ddel >< NspI>< Asul FokI >< 
GTCTTGTITTG CTTTCTGGAC ATAATCTTGC TAAGAAGTGT CTGCATGTTG TTGGACCTAA CCTAAATGCA 
3510 3520 3530 3540 3550 3560 3570 
> < Tru9l 
>< HphI> < Msel 
>< Esp4f 
>< Alul > < Ndel 
>< AfLII>< Fnu4dI >< BbvI 


GGTGAGGACA TCCAGCTTCT TAAGGCAGCA TATGAAAATT TCAATTCACA GGACATCTTA CTTGCACCAT 


3580 3590 3600 3610 3620 3630 3640 
RsaI >< 
Csp6I >< 
>< Ecos7I >< BegI AfaI >< 
TGTTGTCAGC AGGCATATTT GGTGCTAAAC CACTTCAGTC TTTACAAGTG TGCGTGCAGA CGGTTCGTAC 
3650 3660 3670 3680 3690 3700 3710 
>< BsgI >< BspMI 
>< BegI/a >< Alul >< NlaIII 
ACAGGTTTAT ATTGCAGTCA ATGACAAAGC TCTTTATGAG CAGGTTGTCA TGGATTATCT TGATAACCTG 
3720 3730 3740 3750 3760 3770 3780 
>< MnlI 
>< Rmal > < MnlI >< NlaIv >< TEI >< MbolI 
>< Mael >< EcoS7I >< BscBI >< HinfI >< Ddel 
AAGCCTAGAG TGGAAGCACC TAAACAAGAG GAGCCACCAA ACACAGAAGA TTCCAAAACT GAGGAGAAAT 
3790 3800 3810 3820 3830 3840 3850 
>< Trugi 
>< Stul 
>< Pall 
>< Msel >< MnlI >< MaeIII 
>< HaelII >< Ecod0651 
>< Ecol47I >< Eco91I 
>< Rsal >< BsuRI BstXI >< 
>< Cspé6I >< TthHBBl >< BshI >< BstPI 
>< Afal >< Taqi >< AatI >< BstEII 
CTGTCGTACA GAAGCCTGTC GATGTGAAGC CAAAAATTAA GGCCTGCATT GATGAGGTTA CCACAACACT 
3860 3870 3880 3890 3900 3910 3920 
T£iI >< 
NlaIII >< 
HinfI >< 
>< Ddel >< EcoRV >< HindIII 


FIGURE 13.10 
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>< BsrI >< MbolII >< MaellI >< Eco32I >< Alut 
GGAAGAAACT AAGTTTCTTA CCAATAAGTT ACTCTTGTTT GCTGATATCA ATGGTAAGCT TTACCATGAT 
3930 3940 3950 3960 3970 3980 3990 
>< Nspti 
>< NspHTI 
>< NlalIt >< SfaNnI 
>< MnlI > < EcoNt 
>< Ddel >< MboII >< BslI > < NlalIl 
>< Ddel >< BfrI >< HphI >< BsiYI >< FokI 
TCTCAGAACA TGCTTAGAGG TGAAGATATG TCTTTCCTTG AGAAGGATGC ACCTTACATG GTAGGTGATG 
4000 4010 4020 4030 4040 4050 4060 
>< Spel 
>< Rmal 
>< Mael >< EcoRV>< HphI >< SfaNI 
>< HphI >< Eco321 >< Mn1lI >< Ddel 
TTATCACTAG TGGTGATATC ACTTGTGTTG TAATACCCTC CAAAAAGGCT GGTGGCACTA CTGAGATGCT 
4070 4080 4090 4100 4110 4120 4130 
>< Scrkl 
>< RsaI 
>< Mval 
>< EcoRITI 
>< Ecll36I 
>< DsaV 
>< Csp6I >< EcoNI 
>< BstOLl 
>< BstNI 
>< BsiLl 
>< BsaJl 
>< BsaAlI >< BslI 
>< MboII >< MaeII>< ApyI 
>< Alul >< BsrI >< Afal >< BsiYI 
CTCAAGAGCT TTGAAGAAAG TGCCAGTTGA TGAGTATATA ACCACGTACC CTGGACAAGG ATGTGCTGGT 
4140 4150 4160 4170 4180 4190 4200 
>< Trud9t 
>< Msel 
>< Ddel >< Esp4i >< Rsal 
>< MnlI >< BspWI >< Csp6r 
>< FokI >< Alul >< Af1II >< EcoS7I >< Afal 
TATACACTTG AGGAAGCTAA GACTGCTCTT AAGAAATGCA AATCTGCATT TTATGTACTA CCTTCAGAAG 
4210 4220 4230 4240 4250 4260 4270 
>< SerFl 
>< Mval 
>< EcoRII 
>< Xmnt >< Ecll361I Nlal{iI >< 
> < Ksp632I >< Rmal >< DsaVv Ksp632I >< 
> < Earl > < TFLI>< MboII >< Bstor >< Earl 
> < Eaml1041 >< Mael >< BStNI Eam1104I >< 
> < Ddel > < HinfI >< BsiLl BsmAI >< 
>< BspWI >< Asp700I >< ApyI Alw26I >< 
.CACCTAATGC TAAGGAAGAG ATTCTAGGAA CTGTATCCTG GAATTTGAGA GAAATGCTTG CTCATGCTGA 
4280 4290 4300 4310 4320 4330 4340 
>< Vspl >< Zsp2I 
>< Tru9I >< PpuldI 
>< Msel >< Nsil 
>< MboIlI >< NlalIL >< FokI 


>< Ecos71I >< Mphi1l03I >< FokI 
FIGURE 13.11 
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>< Asni >< Ecot22t >< BspWI 
>< Asel >< AvaLlII >< BglI >< MaeIl 
AGAGACAAGA AAATTAATGC CTATATGCAT GGATGTTAGA GCCATAATGG CAACCATCCA ACGTAAGTAT 
4350 4360 4370 4380 4390 4400 4410 
>< SfaNt 
>< Tru9l > < HindII >< TEL >< Spel 
><: MseI > < HincII>< MboII >< Rmal 
>< MnliI >< DrdI >< Hin fI >< Mael 
AARAGGAATTA AAATTCAAGA GGGCATCGTT GACTATGGTG TCCGATTCTT CTTTTATACT AGTAAAGAGC 
4420 4430 4440 4450 4460 4470 4480 
>< MaeIII 
>< SfcI ~ >< Enu4dHI >< MunI 
>< Alul >< Alul >< Acil MaeIII >< 
CTGTAGCTTC TATTATTACG AAGCTGAACT CTCTAAATGA GCCGCTTGTC ACAATGCCAA TTGGTTATGT 
4490 4500 4510 4520 4530 4540 4550 
>< Thal 
>< MvnIiI 
>< MbolI 
>< HinPil 
>< HinPll 
>< Hin6él 
>< Hin6él 
>< Hhal 
>< Trugl >< Hhal 
>< NlaIII “>< Fnu4HI 
>< Msel >< Cfol 
>< MnlI >< Cfol 
>< Ksp632I1 >< BstUT 
>< Earl >< BssHII>< Bspwi >< Trugl 
>< Eamll04I >< BspsOl >< Msel 
>< BbvIi >< AccII >< Alul - HphrI >< 
GACACATGGT TTTAATCTTG AAGAGGCTGC GCGCTGTATG CGTTCTCTTA AAGCTCCTGC CGTAGTGTCA 
4560 4570 4580 4590 4600 4610 4620 
>< MaelII 
>< SfaNI >< AlwNI >< MnlI >< MnlI>< Ddel 
GTATCATCAC CAGATGCTGT TACTACATAT AATGGATACC TCACTTCGTC ATCAAAGACA TCTGAGGAGC 
4630 4640 4650 4660 4670 4680 4690 
>< Sinl 
>< Sau96I 
>< NspIv 
>< NspHII 
>< Sdul >< Eco47I 
>< NspII >< Cfrl3i 
>< HgiAL >< Bsial 
>< Bsp1l2861 >< Bmel8I >< Rsal 
>< BmylI >< AvaII >< Csp6r 
>< Alw21I >< Asul >< Afal 
ACTTTGTAGA AACAGTTTCT TTGGCTGGCT CTTACAGAGA TTGGTCCTAT TCAGGACAGC GTACAGAGTT 
4700 4710 4720 4730 4740 4750 4760 
> < TthHBsI 
> < Tagl 
>< Sdul 
>< Van91I >< Nspit 
>< Tru9l >< RsaI >< PELMI >< Eco24t 
>< Msel >< HphI >< BslI >< Bspl286I1 
>< Esp4I >< Csp6I >< BsiYI >< BmyI GsuI >< 
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>< ALLIT 


AGGTGTTGAA TTTCTTAAGC 
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>< MaeIII >< AfaI >< AccB7I >< BanIIBpmI >< 
GTGGTGACAA AATTGTGTAC CACACTCTGG AGAGCCCCGT CGAGTTTCAT 


4770 4780 4790 4800 4810 4820 4830 
>< Tru9l 
>< PleI >< EcoNI 
>< MnlI >< BslI 
>< BsmAI >< BsiYI 
>< MnliI >< HphI >< HinfI>< Alw261I>< AcilI >< MseI 
CTTGACGGTG AGGTTCTTTC ACTTGACAAA CTAAAGAGTC TCTTATCCCT GCGGGAGGTT AAGACTATAA 
4840 4850 4860 4870 4880 4890 43900 
>< Alul >< Ndet 
AAGTGTTCAC AACTGTGGAC AACACTAATC TCCACACACA GCTTGTGGAT ATGTCTATGA CATATGGACA 
4910 4920 4930 4940 4950 4960 4970 
>< SinI 
>< Saud6ér 
>< NspIv 
>< NspHII 
>< Eco47I 
>< Cfrl3I NlalII >< 
>< BsiZzI >< NlalIItl 
>< BmelBI > < Mnil 
>< Avall >< MaelrIt >< Tru9l >< MniI 
>< Asul >< FokI >< Msel >< BspHI 
GCAGTTTGGT CCAACATACT TGGATGGTGC TGATGTTACA AAAATTAAAC CTCATGTAAA TCATGAGGGT 
4980 4990 5000 5010 5020 5030 5040 
> < TthHBBI 
>< Rsal > < TaqI 
> < Rmal >< SnaBl. >< Scal 
> < Mael >< MaeII >< HindIII >< RsaI 
>< Csp6I >< Ecol05I >< Cspé6éI 
>< Afal >< BsaAI >< Alul >< Afal 
AAGACTTTCT TTGTACTACC TAGTGATGAC ACACTACGTA GTGAAGCTTT CGAGTACTAC CATACTCTTG 
5050 5060 5070 5080 5090 5100 5110 
>< RsaI 
>< NspI 
>< NspHI 
>< NlaIIf 
> < Cspér >< TrugI MnlI > 
>< AfLIII >< MseI BslI >< 
>< Afal >< Dral BsiYI >< 
ATGAGAGTTT TCTTGGTAGG TACATGTCTG CTTTAAACCA CACAAAGAAA TGGAAATTTC CTCAAGTTGG 
5120 5130 5140 5150 5160 5170 5180 
>< Tru9l >< Tru9l ->< Rmal 
>< Msel >< Msel >< Muni >< Mael Alul > 
TGGTTTAACT TCAATTAAAT GGGCTGATAA CAATTGTTAT TTGTCTAGTG TITTATTAGC ACTTCAACAG 
5190 5200 5210 5220 5230 5240 5250 
>< SfaNi 
>< Sdul 
>< NspIiti 
>< Eco24I 
>< Bspl286I 
>< BmyL Hpht > 
>< BbvI Fnu4HI >< 
>< MnlI >< BanIl >< BspWI 
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CTTGAAGTCA AATTCAATGC ACCAGCACTT CAAGAGGCTT ATTATAGAGC CCGTGCTGGT GATGCTGCTA 


5260 5270 5280 5290 9300 5310 9320 
>< Vnelr 
>< Snofl 
>< Sdul 
>< Nspttl 
>< HgiAl 
>< Bspl286l 
>< BmyI 
>< ApaLTI 
>< Alw44T MboITI >< 
>< Alw21I >< Alut >< HphI 
ACTTTTGTGC ACTCATACTC GCTTACAGTA ATAAAACTGT TGGCGAGCTT GGTGATGTCA GAGAAACTAT 
5330 5340 5350 5360 5370 5380 5330 
> < Spht 
> < Pael 
> < NspI 
> < NspHI >< T£Fil >< Tru9l 
>< SfcI > < NlaITi>< Hinft >< Msel 
GACCCATCTT CTACAGCATG CTAATTTGGA ATCTGCAAAG CGAGTTCTTA ATGTGGTGTG TAAACATTGT 
5400 5410 5420 5430 5440 5450 5460 
>< Rsal 
>< Tru9I > < Cspé6I Esp4I > 
>< Msel >< Alul >< Afal AfLII > 
GGTCAGAAAA CTACTACCTT AACGGGTGTA GAAGCTGTGA TGTATATGGG TACTCTATCT TATGATAATC 
5470 5480 5490 5500 9510 5520 5530 
>< Rsal 
>< MboII 
>< RmalHinfI >< 
>< CspéI 
>< Trudl >< SfaNt >< MaeI >< BbsI 
>< Msel >< NlalII >< Afal 
TTAAGACAGG TGTTTCCATT CCATGTGTGT GTGGTCGTGA TGCTACACAA TATCTAGTAC AACAAGAGTC 
5540 5550 5560 5570 5580 5590 5600 
>< Rsal 
>< PleI > < Ddel >< Csp6I 
>< BsgI >< BspWI >< BspMI >< Afal 
TTCTTTTGTT ATGATGTCTG CACCACCTGC TGAGTATAAA TTACAGCAAG GTACATTCTT ATGTGCGAAT 
5610 5620 5630 5640 5650 5660 5670 
>< Eco3lI 
>< Rsal >< Ddel 
> < MaelllI >< BsmAL 
>< Csp6ét >< Bsal MniI >< 
>< AfaI >< BsrI >< Alw26L HphtI > 
GAGTACACTG GTAACTATCA GTGTGGTCAT TACACTCATA TAACTGCTAA GGAGACCCTC TATCGTATTG 
5680 5690 5700 5710 5720 5730 5740 
>< SstI >< Sinl 
>< Sdul >< Sau96t 
>< SacI >< NspIv 
>< NspII >< NspHII 
>< HgiAl > < RsaI >< MaeIIl 
>< Eco24t >< Eco471I 
>< Ecll36II >< Cfri3t 
>< Bsp1l286I >< BsiZt 
>< Bmyl >< Bmel8T 
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>< Banit >< Avallt 
>< Alw2il >< Csp6I>< Asul 
>< Alul > < AfaI >< BsrI>< AlwNI 
ACGGAGCTCA CCTTACABAG ATGTCAGAGT ACAAAGGACC AGTGACTGAT GTTTTCTACA AGGAAACATC 
5750 5760 5770 5780 5790 5800 5810 
>< TthHBsl 


>< TaqI >< MaeIII 
TTACACTACA ACCATCAAGC CTGTGTCGTA TAAACTCGAT GGAGTTACTT ACACAGAGAT TGAACCAAAA 


5820 5830 5840 5850 5860 5870 5880 
>< Rsal 
>< CspéL 
>< SfcI >< BbvI 
>< FokI >< Fnu4Ht >< Afal 
TTGGATGGGT ATTATAAAAA GGATAATGCT TACTATACAG AGCAGCCTAT AGACCTTGTA CCAACTCAAC 
5890 5900 5910 5920 5930 5940 5950 
Tru9I >< 
Swal >< 
MseI >< 
> < NspI "Mami >< 
> < NspHI Dral >< 
> < NlalII BsiBI >< 
>< AELIIT : BsaBI >< 
CATTACCAAA TGCGAGTTTT GATAATTTCA AACTCACATG TTCTAACACA AAATTTGCTG ATGATTTAAA 
5960 5970 5980 5990 6000 6010 6020 
>< MbolI 
>< Alul >< AlulI>< MaeIII 
TCAAATGACA GGCTTCACAA AGCCAGCTTC ACGAGAGCTA TCTGTCACAT TCTTCCCAGA CTTGAATGGC 
6030 6040 6050 6060 6070 6080 6090 
>< SfcI 
GATGTAGTGG CTATTGACTA TAGACACTAT TCAGCGAGTT TCAAGAAAGG TGCTAAATTA CTGCATAAGC 
6100 6110 6120 6130 6140 6150 6160 
>< TruSt 
>< SerFI 
>< Mval 
>< Msel 
>< EcoRIt 
>< Ecll36I 
>< DsaV 
>< Bstol 
>< BsStNI MaeII >< 
>< Munt >< BsiLI >< DralIlI 
>< BsStXkT >< Apyl >< MaelIl >< Bstxt 
CAATTGTTTG GCACATTAAC CAGGCTACAA CCAAGACAAC GTTCAAACCA AACACTTGGT GTTTACGTTG 
6170 6180 6190 6200 6210 6220 6230 
> < Rsal 
>< Csp6l MbolII >< 
> < AfaI>< Bsrl >< BosI 
TCTTTGGAGT ACAAAGCCAG TAGATACTTC AAATTCATTT GAAGTTCTGG CAGTAGAAGA CACACAAGGA 
6240 6250 6260 6270 6280 6290 6300 
>< Hindil >< MbolII 
>< Hincll >< Mnilt >< EcoSTi 
ATGGACAATC TTGCTTGTGA AAGTCAACAA CCCACCTCTG AAGAAGTAGT GGAAAATCCT ACCATACAGA 
6310 6320 6330 6340 6350 6360 6370 
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>< MaelII >< Trudl 
>< Maell >< Msel 
AGGAAGTCAT AGAGTGTGAC GTGAAAACTA CCGAAGTTGT AGGCAATGTC ATACTTAAAC CATCAGATGA 
6380 6390 6400 6410 6420 6430 6440 
>< XholI 
>< Sau3Al 
>< NlaIil 
>< NdeII 
>< Mf£1T 
>< Mbol 
>< Dpnit 
>< Dpnl 
>< BstYI 
>< Tru9I >< BspAI 
>< MseI >< BspHI >< Bspl43I>< Fnu4HI 
> < MaelIl >< MnLI >< BbvI >< AlwI 
AGGTGTTAAA GTAACACAAG AGTTAGGTCA TGAGGATCTT ATGGCTGCTT ATGTGGAAAA CACAAGCATT 
6450 6460 6470 6480 6490 6500 6510 
>< Saul 
>< Rmal 
>< MstIit 
>< Mael 
>< Eco8il 
>< DdelI 
>< CvnI 
>< Bsu36f 
>< Bse21Ii 
>< BfrI> < Tru9I 
>< Trug9l >< AxyI> < MseI>< MunI >< NlalII 
>< Msel >< Alul >< AocI >< Dral >< BbvI Fnu4HI >< 
ACCATTAAGA AACCTAATGA GCTTTCACTA GCCTTAGGTT TAAAAACAAT TGCCACTCAT GGTATTGCTG 
6520 6530 6540 6550 6560 6570 6580 
>< VspI >< Styl 
>< Tru9l >< EcoTl4I > < Ddel 
>< Msel >< Ecol30I >< BslI 
>< Asni >< BssTLI >< BsiYl 
>< Asel >< BsaJI > < Bfrl >< Fnud4dl 
CAATTAATAG TGTTCCTTGG AGTAAAATTT TGGCTTATGT CAAACCATTC TTAGGACAAG CAGCAATTAC 
6590 6600 6610 6620 6630 6640 6650 
>< HinPlI 
>< Hinél >< Tru9l 
>< Hhal >< MaeII>< Msel 
>< Ddel >< DralIl 
>< BbvI >< Cfol >< AFfLIIT 
AACATCAAAT TGCGCTAAGA GATTAGCACA ACGTGTGTTT AACAATTATA TGCCTTATGT GTTTACATTA 
6660 6670 6680 6690 6700 6710 6720 
>< Rsal > < Rsal>< XbaI 
>< CspéI >< Csp6I >< Rmal 
>< MunI >< Afal > < AfaI >< Mael >< Alul 
TTGTTCCAAT TGTGTACTTT TACTAAAAGT ACCAATTCTA GAATTAGAGC TTCACTACCT ACAACTATTG 
6730 6740 6750 6760 6770 6780 6790 
>< Vspl 
>< Tru9l 
>< Nael 
>< Mspr 
>< Msel 
FIGURE 13. 16 
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>< Apall 
>< HapItr 
>< CfrlOI >< Fok 
>< Tru9I >< AsnI 
>< MseI >< SfaNI >< AseI>< HphI>< MaelII 
CTAAAAATAG TGTTAAGAGT GTTGCTAAAT TATGTTTGGA TGCCGGCATT AATTATGTGA AGTCACCCAA 
6800 6810 €820 6830 6840 - 6850 6860 
>< Tru9l >< Ddel MaeIII > 
>< Msel >< BfrI >< BbvI 
ATTTTCTAAA TTGTTCACAA TCGCTATGTG GCTATTGTTG TTAAGTATTT GCTTAGGTTC TCTAATCTGT 
6870 6880 6890 6900 6910 6920 6930 
>< Sdul 
>< NspIi 
>< HgiAL 
> < Rsal >< Bspl286I 
>< Cspé6t >< Bmyl 
>< Fnud4HI > < Afal >< Alw21I ; 
GTAACTGCTG CTTTTGGTGT ACTCTTATCT AATTTTGGTG CTCCTTCTTA TTGTAATGGC GTTAGAGAAT 
6940 6950 6960 6970 6980 6990 7000 
Tru9I >< 
MseI >< 
>< TruSL > < MaeIII >< Fnud4Hl 
>< Msel >< Maell BbvI > 
TGTATCTTAA TTCGTCTAAC GTTACTACTA TGGATTTCTG TGAAGGTTCT TTTCCTTGCA GCATTTGTTT 
7010 7020 7030 7040 7050 7060 7070 
> < Tfil RsaI >< 
>< MamI >< HphI 
> < HinftI Csp6I >< 
>< BsiBI >< XmnI>< MaellII Alul > 
>< PleI>< Hinfl >< BsaBI >< Alul >< Asp700I AfaI >< 
AAGTGGATTA GACTCCCTTG ATTCTTATCC AGCTCTTGAA ACCATTCAGG TGACGATTTC ATCGTACAAG 
7080 7090 7100 7110 7120 7130 7140 
>< Pall 
>< NspBIT 
>< Haelil 
>< Gdill 
>< Fnu4HI 
>< Eael 
>< Ddel 
y >< BsuRI 
>< Rmal >< BshI >< BslI 
>< Mael >< AcilI>< BsiYI 
CTAGACTTGA CAATTTTAGG TCTGGCCGCT GAGTGGGTTT TGGCATATAT GTTGTTCACA AAATTCTTTT 
7150 7160 7170 7180 7190 7200 7210 
>< BspMI >< Rmal 
>< Alul >< Mael 
ATTTATTAGG TCTTTCAGCT ATAATGCAGG TGTTCTTTGG CTATTTTGCT AGTCATTTCA TCAGCAATTC 
7220 7230 1240 7250 7260 7270 7280 
RsaI >< 
>< MbolI 
>< Nlalv MamI >< 
>< Eco64I Csp6I >< 
> < RsaI >< BscBI BsiBI >< 
>< Csp6I >< BanI BsaBI >< 
> < NlaIII > < AfaI>< AccBil AfaI >< 
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TIGGCTCATG TGGTTTATCA TTAGTATTGT ACAAATGGCA CCCGTTTCTG CAATGGTTAG GATGTACATC 


7290 7300 7310 7320 7330 7340 7350 
TrhHB8I >< 
>< TaqI 
MniI >< 
>< Ndef Ksp632I >< 
>< Ksp632I >< FokI 
>< Earl >< MboII EarI >< 
>< EFokI >< Eamli04iI>< AluI>< MboII >< NlaIII Eamli04di >< 
TTCTTTGCTT CTTTCTACTA CATATGGAAG AGCTATGTTC ATATCATGGA TGGTTGCACC TCTTCGACTT 
7360 7370 7380 7390 7400 7410 7420 
xholI >< 
Sau3AI >< 
NlalII >< 
NdeII >< 
MELI >< 
MboI >< 
>< Thal > < Ksp632I 
>< Mvnl > < Bart 
>< HinPil >< Mlul > < Eam1104fI 
>< Hin6éI >< BstUI DpniI >< 
>< Hhal >< Bsp50I >< Rsal BstYI >< 
>< NiafIl >< Cfol >< AfLIII >< Cspé6I >< Tru9I BspATI >< 
>< BspWI >< BspWI >< AccII >< Afal >< Msel BglII >< 
GCATGATGTG CTATAAGCGC AATCGTGCCA CACGCGTTGA GTGTACAACT ATTGTTAATG GCATGAAGAG 
7430 7440 7450 7460 7470 7480 7490 
>< Pall 
>< Haelil 
>< Dsal >< Munt 
>< MbolI >< BsuRI MaeIl{I >< 
>< Dpni >< BshI >< Munt BsmAI >< 
>< Bsp143I >< Mnlt >< BsaJI >< PleI>< HinfI Alw26I >< 
ATCTTTCTAT GTCTATGCAA ATGGAGGCCG TGGCTTCTGC AAGACTCACA ATTGGAATTG TCTCAATTGT 
7500 7510 7520 7530 7540 7550 7560 
>< Rsal TruSl >< 
> < Csp6I MseI >< 
>< Bsri >< Gsul >< MaelII[DralI >< 
; >< Afal >< Bom > < BsrI 
GACACATTTT GCACTGGTAG TACATTCATT AGTGATGAAG TTGCTCGTGA TTTGTCACTC CAGTTTAAAA 
7570 7580 7590 7600 7610 7620 7630 
>< Thal 
>< Mvnl 
> < Hpht 
HinPlI >< 
>< HinP1I 
>< Hin6éI 
>< Hin6ol 
HhaI >< 
>< Hhal 
CfoI >< 
>< C£oI 
>< BstUL 
>< BssHIL 
Bsp50I >< 
> < Bsri >< AcclII 
GACCAATCAA CCCTACTGAC CAGTCATCGT ATATTGTTGA TAGTGTTGCT GTGAAAAATG GCGCGCTTCA 
7640 7650 7660 7670 7680 7690 7700 
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>< FokI 
>< BsmAI 
>< MnilI >< Alw26I >< Acil 
CCTCTACTTT GACAAGGCTG GTCAAAAGAC CTATGAGAGA CATCCGCTCT CCCATTTTGT CAATTTAGAC 
7710 7720 7730 71740 7750 7760 7770 
>< VspI 
>< Trugl 
>< Msel 
>< Asni 
> < Alul >< Asel >< BegI/a 
AATTTGAGAG CTAACAACAC TAAAGGTTCA CTGCCTATTA ATGTCATAGT TTTTGATGGC AAGTCCADAT 
7780 7790 7800 7810 7820 7830 7840 
>< StcI >< Pvull 
>< Rsal >< PspstI 
>< PleI >< Csp6lL >< NspBII 
>< HinfI >< Ddel >< BegI >< AfalI >< Alul 
GCGACGAGTC TGCTTCTAAG TCTGCTTCTG TGTACTACAG TCAGCTGATG TGCCAACCTA TTCTGTTGCT 
7850 7860 7870 7880 7890 7900 7910 
TChHBSI >< 
TaqI >< 
SalI >< 
RtrI >< 
>< Scal HindII > 
>< Rsal >< Trugt HincII > 
>< Cspé6éL >< SfaNI >< EcoS7I 
>< AluI >< Maell >< Afal >< Mser © AccI >< 
TGACCAAGCT CTTGTATCAG ACGTTGGAGA TAGTACTGAA GTTTCCGTTA AGATGTTTGA TGCTTATGTC 
7920 71930 7940 7950 7960 7970 7980 
>< TrudTl 
>< Msel 
> < Esp4i >< SfcI 
> < AfLII >< BspWI >< Alul 
GACACCTTTT CAGCAACTTT TAGTGTTCCT ATGGAAAAAC TTAAGGCACT TGTTGCTACA GCTCACAGCG 
7990 8000 8010 8020 8030 8040 8050 
>< Pvull 
>< Psp5st 
>< NspBII 
>< Enu4dT 
>< Alul >< BbvI >< Alul 
AGTTAGCAAA GGGTGTAGCT TTAGATGGTG TCCTTTCTAC ATTCGTGTCA GCTGCCCGAC AAGGTGTTGT 
8060 8070 8080 8090 8100 8110 8120 
MaeIII >< 
>< HindIt >< BsmATI >< Ddel 
>< HinclII >< FokI>< Alw26I >< BfrI 
TGATACCGAT GTTGACACAA AGGATGTTAT TGAATGTCTC AAACTTTCAC ATCACTCTGA CTTAGAAGTG . 
8130 8140 8150 8160 8170 8180 8190 
>< XhoII 
Sau3AI >< 
>< NdeII 
>< Mf1I 
>< Mbol 
>< NlalII >< Hgal 
>< HinlI >< DpnIti 
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DpnI >< 


>< MaeIII>< HphI 
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Bsp1431I >< 
>< BsaHI >< BstYI 
>< BbilI >< BspAI 


>< MaeLil >< Hpht >< NlalIt >< AcyI >< BglII 
ACAGGTGACA GTTGTAACAA TTTCATGCTC ACCTATAATA AGGTTGAAAA CATGACGCCC AGAGATCTTG 
8200 8210 8220 8230 8240 8250 8260 
>< NspI 
>< NspHI 
>< NlaliI 
>< HinPlI 
>< HinoI 
>< Hhal 
>< Cfol >< BspWI >< MaelII 
GCGCATGTAT TGACTGTAAT GCAAGGCATA TCAATGCCCA AGTAGCAAAA AGTCACAATG TTTCACTCAT 
8270 8280 8290 8300 8310 8320 8330 
>< NspI 
>< NspHI >< Pvull 
>< NlalIlI >< Psp5I 
>< Eam1105I >< NspBII 
>< BbvI >< Enu4AL 
>< AfLIII >< Alul >< BbvI > < Fnu4ht 
CTGGAATGTA AAAGACTACA TGTCTTTATC TGAACAGCTG CGTAAACAAA TTCGTAGTGC TGCCAAGAAG 
8340 8350 8360 8370 8380 8390 8400 
>< Rmal 
>< MboII >< MaeI >< Eam1l105I 
AACAACATAC CTTTTAGACT AACTTGTGCT ACAACTAGAC AGGTTGTCAA TGTCATAACT ACTAAAATCT 
8410 8420 8430 8440 8450 8460 - 8470 
>< Trugl 
>< Pall 
>< Msel 
>< HaellII 
>< Scal >< Esp4l 
>< RsaI >< Trud9I >< BsuRI 
>< Csp6I >< Msel >< BshI 
>< Afal >< Dral >< AfLIT >< BbovI 
CACTCAAGGG TGGTAAGATT GTTAGTACTT GTTTTAAACT TATGCTTAAG GCCACATTAT TGTGCGTTCT 
8480 8490 8500 8510 8520 8530 8540 
>< Rsal 
>< CspéI 
>< BsrI >< Nlalil 
>< Fnu4dklT >< Afal >< MaeliIi 
TGCTGCATTG GTTTGTTATA TCGTTATGCC AGTACATACA TTGTCAATCC ATGATGGTTA CACAAATGAA 
8550 8560 8570 8580 8590 8600 8610 
>< MaelII 
> < Maelii 
>< MaeLIt >< FokI 
ATCATTGGTT ACAAAGCCAT TCAGGATGGT GTCACTCGTG ACATCATTTC TACTGATGAT TGTTTTGCAA 
8620 8630 8640 8650 8660 8670 8680 
SfcI > 
>< Nspt FnudHI >< 
>< NspHI >< NlallIl BbvI >< 
>< NlalII >< Hgal >< BstxI >< BbvI >< Alul 
ATAAACATGC TGGTTTTGAC GCATGGTTTA GCCAGCGTGG TGGTTCATAC AAAAATGACA AAAGCTGCCC 
8690 8700 8710 8720 8730 8740 8750 
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>< Fnud4dHI 
>< Alul 
TGTAGTAGCT GCTATCATTA 
8760 8770 


CAAGAGAGAT 
8780 


> < MaeIItI >< HphI 
GCAATCAATG GTGACTTCTT GCATTTTCTA 
8830 8840 8850 


CATTGAGTAT AGTGATTTTG 
8910 8920 


CT TCCAAACT 
8900 


>< FokI 
ATGGGCAAAC CTGTGCCATA 
8980 8990 


TAAGGATGCT 
8970 


>< Alul 
AGTGAGCTTC GTCCAGACAC TCGTTATGTG 
9040 9050 39060 


>< SfaNt 
> < MaelIII 
>< Gsul 
>< Bpmt 
TGGAGGGTTC TGTTAGAGTA GTAACAACTT 
9110 9120 9130 
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>< ScrFI 
>< ScrkL >< Rsal 
>< MvaI >< MspI 
>< EcoRII >< Hpall 
>< Ecll36I>< Ncil 
>< DsaVv >< HapIt 
>< BstOI>< Dsav 
>< BstNI >< Cspé6I 
>< BsiLI >< BenIDdeI >< 
>< Apyl >< Afal 
TGGTTTCATA GTGCCTGGCT TACCGGGTAC TGTGCTGAGA 
8790 8800 8810 8820 


>< Mnli >< BspwWI 
CCTCGTGTTT TTAGTGCTGT TGGCAACATT TGCTACACAC 
8860 8870 8880 8890 


Tru9I > 
SfaNI >< 
>< Rsal 
MseI > 
>< BspWI >< Fnu4HI >< CspérI 
>< BbvI>< Mnit >< DdeI >< Afal 
CTACCTCTGC TTIGCGTTCTT GCTGCTGAGT GTACAATTTT 


8930 8940 8950 8960 
> < RmaTl 
>< Mnli 
> < Mael 
TTGTTATGAC ACTAATTTGC TAGAGGGTTC TATTTCTTAT 
9000 9010 9020 9030 
SecrFI > 
MvaLI > 
Mnlf >< 
EcoRII >< 
Ecl136I > 
DsaV >< 
BstOI > 
>< NlaIv BstNI > 
>< FokI BsiLI > 
>< BscBI ApyI > 
CTTATGGATG GTTCCATCAT ACAGTTTCCT AACACTTACC 
9070 9080 9090 9100 
>< Rsal 
>< SfcI >< Nspt 
>< Scal >< NspHI 
>< Rsal >< NlaLlil 
>< Cspé6.r >< Nlalil 
>< Afal >< Csp6r 
>< Ddel >< AccI >< Afar 
TTGATGCTGA GTACTGTAGA CATGGTACAT GCGAAAGGTC 
9140 9150 9160 9170 
>< SstI 
>< Sdul 
>< Sacl 
NspIt >< 
HgiAI >< 
Eco24I >< 
Bspl286I >< 
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Ecl1l361I ><>< Bmyl 


Baniit >< 
>< Trugl Alw21I >< 
>< BsrI >< Msel >< Alul 
AGAAGTAGGT ATTTGCCTAT CTACCAGTGG TAGATGGGTT CTTAATAATG AGCATTACAG AGCTCTATCA 
9180 9190 9200 9210 9220 9230 9240 
>< Tfil 
>< SfaNI >< HinfI >< Alul >< MnlI- 
GGAGTTTTCT GTGGTGTTGA TGCGATGAAT CTCATAGCTA ACATCTTTAC TCCTCTTGTG CAACCTGTGG 
9250 9260 9270 9280 9290 9300 9310 
>< MaelII 
HphI >< 
>< Eco57I > < BbvI Fnu4HI >< 
GTGCTTTAGA TGTGTCTGCT TCAGTAGTGG CTGGTGGTAT TATTGCCATA TIGGTGACTT GTGCTGCCTA 
9320 9330 9340 9350 9360 9370 9380 
>< Rsal 
>< Cspéi >< NlaIII 
>< Maell >< BbvI >< Fnu4Ht 
>< AfLIII >< Afal>< HphI >< BspWI 
CTACTTTATG AAATTCAGAC GTGTTTTTGG TGAGTACAAC CATGTTGTTG CTGCTAATGC ACTTTTGTTT 
9390 9400 9410 9420 9430 9440 9450 
>< Rsal 
>< NlalVv 
>< Kpni 
>< Eco64r > < ScrFI 
>< Cspérl > < Neil 
>< BscBI >< MspI 
>< Asp718 >< Hpall 
>< BanI >< Alul >< HinfTI 
>< Afal >< HapII >< PleI 
>< AccBil > < Benl > < Ddel 
>< Acc65I >< AlulI>< DsaV >< AccI 
TTGATGTCTT TCACTATACT CTGTCTGGTA CCAGCTTACA GCTTTCTGCC GGGAGTCTAC TCAGTCTTTT 
9460 9470 9480 9490 9500 9510 9520 
>< Rsal 
>< Cspélr 
>< Afal >< HphIi >< Hphi NlaIII >< 
ACTTGTACTT GACATTCTAT TTCACCAATG ATGTTTCATT CTTGGCTCAC CTTCAATGGT TTGCCATGTT 
9530 9540 9550 9560 9570 9580 9590 
TTCTCCTATT GTGCCTTTTT GGATAACAGC AATCTATGTA TTCTGTATTT CICTGAAGCA CTGCCATTGG 
9600 9610 9620 9630 9640 9650 9660 
>< TthHBst 
>< Rsal 
>< MnlI 
>< MnlI 
>< Trugi >< Cspé6r 
>< Tru9t >< Plel >< Begi/a >< TaqI 
>< Msel >< Ddel >< NlalIIlI >< BbvI 
>< EcoS7I >< BfrI >< HinfI >< Msel >< MaelIII >< Afal Fnu4dHI >< 
TTCTTTAACA ACTATCTTAG GAAAAGAGTC ATGTTTAATG GAGTTACATT TAGTACCTTC GAGGAGGCTG 
9670 9680 9690 9700 9710 9720 9730 
>< Rsal 
>< Csp6l >< Rsal 
>< BegI >< CspéI >< BsmAI 
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>< Afal >< Afal >< Alw26TI 
CTTTGTGTAC CTTTTTGCTC AACAAGGAAA TGTACCTAAA ATTGCGTAGC GAGACACTGT TGCCACTTAC 
9740 9750 9760 9770 9780 9790 9800 
>< NlaIv 
>< Rsal >< Ddel 
>< Cspél >< BscBI 
>< Afal >< BfrI AluI >< 
ACAGTATAAC AGGTATCTTG CTCTATATAA CAAGTACAAG TATTTCAGTG GAGCCTTAGA TACTACCAGC 
9810 9820 9830 9840 9850 9860 9870 
>< Fnud4HI 
>< Ddel 
>< Fnud4hI >< BfrI 
>< BbovI >< Alul >< BbvI >< DdeI >< AlwNI 
TATCGTGAAG CAGCTTGCTG CCACTTAGCA AAGGCTCTAA ATGACTTTAG CAACTCAGGT GCTGATGTTC 
98B0 9890 9900 9910 9920 9930 9940 
>< Sfcl >< BsmI 
>< PstI >< BscCI 
TCTACCAACC ACCACAGACA TCAATCACTT CTGCTGTTCT GCAGAGTGGT TTTAGGAAAA TGGCATTCCC 
9950 9960 9970 9980 9990 10000 10010 
>< Rsal 
>< NlaIItI 
>< MaeIII 
>< Cspé6él >< Tru9I 
>< Afal >< Msel 
GTCAGGCAAA GTTGAAGGGT GCATGGTACA AGTAACCTGT GGAACTACAA CTCTTAATGG ATTGTGGTTG 
10020 10030 10040 10050 10060 10070 10080 
XhoII >< 
Sau3AI >< 
>< TrudI NdeII >< 
>< NspL MflI >< 
>< NspHI MboI >< 
>< NspI >< NlalII DpniI >< 
>< FokI. >< NspHI >< Msel BstYI >< 
>< Bst11071 >< NlaIII >< MboIT BspAI >< 
>< Accl >< Af1IIIL > < BbsI BglII >< 
GATGACACAG TATACTGTCC AAGACATGTC ATTTGCACAG CAGAAGACAT GCTTAATCCT AACTATGAAG 
10090 10100 10110 10120 10130 10140 10150 
Pall > 
MscI > 
HaelII > 
EaelI >< 
BsuRI > 
>< DpnI >< MboII BshI > 
>< Bspl43I >< Alul Ball > 
ATCTGCTCAT TCGCAAATCC AACCATAGCT TTCTTGTTCA GGCTGGCAAT GTTCAACTTC GTGTTATTGG 
10160 10170 10180 10190 10200 10210 10220 
>< DdeI> < Tru9I 
>< B£rI> < Msel >< Ddel 
CCATTCTATG CAAAATTGTC TGCTTAGGCT TAAAGTTGAT ACTTCTAACC CTAAGACACC CAAGTATAAA 
10230 10240 10250 10260 10270 10280 10290 
>< ScrFfI 
>< Mval 
>< EcoRII 
>< Ecll36I1 >< SphI 
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>< DsaV >< Paer 
>< BstOl >< Nspt 
>< BstNI >< NspHI 
>< BsiLI >< RmaIl >< NlalII 
>< Apyl >< Mael >< HphI 
TTTGTCCGTA TCCAACCTGG TCAAACATTT TCAGTTCTAG CATGCTACAA TGGTTCACCA TCTGGTGTTT 
10300 10310 10320 10330 10340 10350 10360 
>< Sau3Al 
>< NdelIl 
>< MbolI>< NlaIII 
>< Eco3ll >< Doni 
>< BsmAT >< Tru9I>< Dpni 
>< BsaI>< NlalIl >< Trugl >< MseI >< Bspl43I 
>< Alw26I >< Msel >< BspAI>< AlwI 
ATCAGTGTGC CATGAGACCT AATCATACCA TTAAAGGTTC TTTCCTTAAT GGATCATGTG GTAGTGTTGG 
10370 10380 10390 10400 10410 10420 10430 
>< Z2sp2t 
>< PpulOI 
>< Nsil>< SfaNI 
>< NdeI 
>< Mph11031 RsaI >< 
>< Tru9l >< EcoT22I Csp6I >< 
>< Msel > < AvaLIl >< Alul AfaI >< 
TTTTAACATT GATTATGATT GCGTGTCTTT CTGCTATATG CATCATATGG AGCTTCCAAC AGGAGTACAC 
10440 10450 10460 10470 10480 10490 10500 
>< Sint 
>< Sau961 
>< NspIv 
>< NspHITI >< Sfcl 
>< Eco4d7I RsaI >< 
>< Cf£ri3I PstI >< 
>< Bsial >< Fnu4Hi 
>< Rsal >< Bmel8I >< HindItI Csp6I >< 
>< Csp6I>< Ddel >< Avall >< HinclIt >< BspWI 
>< AfaI>< BfrI >< Asul>< BsgI >< BbvI >< BspMI AfaI >< 
GCTGGTACTG ACTTAGAAGG TAAATTCTAT GGTCCATTTG TTGACAGACA AACTGCACAG GCTGCAGGTA 
10510 10520 10530 10540 10550 10560 10570 
>< Trudl >< Nlalil 
>< Msel >< BbvI >< Fnu4Hl HphI >< 
CAGACACAAC CATAACATTA AATGTTTTGG CATGGCTGTA TGCTGCTGTT ATCAATGGTG ATAGGTGGTT 
10580 10590 10600 10610 10620 10630 10640 
>< Tru9I 
>< T£iT 
>< Msel >< Rsal 
>< HphI >< Tru9I >< Csp6éI 
>< HinfI >< Msel >< AfaL 
TCTTAATAGA TTCACCACTA CTTTGAATGA CTTTAACCTT GTGGCAATGA AGTACAACTA TGAACCTTTG 
10650 10660 10670 10680 10630 10700 10710 
>< Sint 
>< Sau96I 
>< Psst 
>< Psp5Stil 
>< PpuMI 
>< Nspiv 
>< NspHITI 
>< Nlalv 
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>< EcoO10gr 
>< Eco47I 
>< Sau3AI _?< DraIl 
>< NdeIT >< Cfr13I 
>< Mboflt >< Bsizi 
>< Dpnii>< NlalII >< BscBI 
>< DpniI >< HindII >< Bmel8I >< Ddel 
>< BspAI >< HincII >< Avall >< BfrI 
>< Bspl43I >< Asul >< MnlI >< BbvI 
ACACAAGATC ATGTTGACAT ATTGGGACCT CITTCTGCTC AAACAGGAAT TGCCGTCTTA GATATGTGTG 
10720 10730 10740 10750 10760 10770 10780 
>< Styl 
>< RsaI 
>< EcoTl4I 
>< Ecol30I 
>< SfclI > < Csp6L 
>< Fnu4HI >< Fnu4hI >< BssTLI 
>< BbvI >< Fnu4HI >< BsaJI 
>< BbvI >< Alul >< PstI >< Afal : 
CTGCTTTGAA AGAGCTGCTG CAGAATGGTA TGAATGGTCG TACTATCCTT GGTAGCACTA TTTTAGAAGA 
10790 10800 10810 10820 10830 10840 10850 
>< Styl 
>< EcoTl4t 
>< Ecol301 
>< BssTLI 
>< Mboll > < MaeIII>< BsaJI 
TGAGTTTACA CCATTTGATG TTGTTAGACA ATGCTCTGGT GTTACCTTCC AAGGTAAGTT CAAGAAAATT 
10860 10870 10880 10890 10900 10910 10920 
>< SfaNnI 
> < Sdul 
> < NspIti >< Trugl RsaI >< 
>< Tru9I> < Bspl286I >< Msel >< T£iI Csp6I >< 
>< MseI > < BmyI >< FokI >< Hinfl AfaI >< 
GTTAAGGGCA CTCATCATTG GATGCTTTTA ACTTTCTTGA CATCACTATT GATTCTTGTT CAAAGTACAC 
10930 10940 10950 10960 10970 10980 10390 
>< Xmni >< MunI 
>< BsmI Fnu4HI > 
>< BscCI BspWI >< 
>< MaeLlII >< Asp700TL >< BbovI BbvI > 
AGTGGTCACT GTTTTTCTTT GTTTACGAGA ATGCTTTCTT GCCATTTACT CTTGGTATTA TGGCAATTGC 
11000 11010 11020 11030 11040 11050 11060 
>< Nspt 
>< NspHI >< Tru9l 
>< NlalIIt >< Msel >< Bsmt 
>< BspWI >< Fnu4HI>< BspWI >< BscCI >< MaelIlII 
TGCATGTGCT ATGCTGCTTG TTAAGCATAA GCACGCATTC TTGTGCTTGT TTCTGTTACC TTCTCTTGCA 
11070 11080 11090 11100 11110 11120 11130 
>< SfaNI 
>< Rmal 
> < Nspi >< Mami 
> < NlallIl >< HphI 
>< Nhel >< BspHI 
>< Trugl >< Mael >< BsiBlL >< NlaIitr 
>< BspwWI >< Msel >< AccI> < NspHI>< Alul >< BsaBI >< NlallII 
ACAGTTGCTT ACTTTAATAT GGTCTACATG CCTGCTAGCT GGGTGATGCG TATCATGACA TGGCTTGAAT 
11140 11150 11160 11170 11180 11190 11200 
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> < Rmal > 
> < Mael 
>< Alul > 
TGGCTIGACAC TAGCTTGTCT GGTTATAGGC 
11210 11220 11230 


> < NlalIII >< SfaNI 

>< BspHI >< AluI >< Bbvi 
TATTCTCATG ACAGCTCGCA CTGTTTATGA 
11280 11290 11300 


>< AccI 
ACACTTGTTT ACAAAGTCTA CTATGGTAAT 
11350 11360 11370 


>< MaeliIt >< Mnli >< Mae 
CTGTAACCTC TAACTATTCT GGTGTCGTTA 
11420 11430 11440 


TGTTGAGTAT TACCCATTGT TATTTATTAC 
11490 11500 11510 


>< 

>< 

>< Fnu4dt >< 

>< BbovI >< Fnu4hL >< Bsp 

>< BbvI >< BspwWI aS 
TTAGGCTATT GTTGCTGCTG CTACTTTGGC 
11560 11570 11580 


>< Eco3lI 
>< BsmAI 
>< Bsal 
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>< Tru9l 
>< Msel 
< Esp4f 
>< EcodS7I 
< AfLII >< Alul 
TTAAGGATTG TGTTATGTAT GCTTCAGCTT TAGTTTTGCT 
11240 11250 11260 11270 
>< Rmal 
>< Maelli 
>< Maer 
>< Fnud4Hti 
>< ALLIII 
TGATGCTGCT AGACGTGTTT GGACACTGAT GAATGTCATT 
11310 11320 11330 11340 
>< Saug96I 
>< Pall 
>< NspIv 
>< NlalII 
>< Haelll 
>< Sau3Al > < Ddel 
>< NdeII >< Cfrl3I 
>< Mbol >< BsuRI 
>< DpnIl >< BsiZI 
>< Opnt >< BshI 
>< Bsp1l43I > < BfrI 
>< BspAI>< Alul >< Asul 
GCTTTAGATC AAGCTATTTC CATGTGGGCC TTAGTTATTT 
11380 11390 11400 11410 
>< Rmal 
>< NlalII 
>< Mael>< Sfcl 
Til >< AluI>< Alu 
CGACTATCAT GTTTTTAGCT AGAGCTATAG TGTTTGTGTG 
11450 11460 LL470 11480 
DdeI > 
>< Bsrl >< NlaIII Bfrt > 
TGGCAACACC TTACAGTGTA TCATGCTTGT TTATTGTTTC 
11520 11530 11540 11550 
Pall 
HaelIlL 
BsuRI 
WI 
BshI >< Eco57I >< MaeIII 
CTTTTCTGTT TACTCAACCG TTACTTCAGG CTTACTCTTG 
11590 11600 11610 11620 
>< SerFi 
>< Mval 
>< EcoRII 
>< Ecll36I 
>< DsaVv 
>< BstOl 
>< BstNIi 
>< BsiLI 
> < BsaJI 
>< BsaJI 
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: >< DrdI >< Alw26I >< ApyI DdeI >< 
GTGTTTATGA CTACTTGGIC TCTACACAAG AATTTAGGTA TATGAACTCC CAGGGGCTTT TGCCTCCTAA 
11630 11640 11650 11660 11670 11680 11690 
>< Tru9L 
>< Msel 
>< SfaNI > < HindIII> < Tru9I 
>< MnalI >< AluI > < Msel > < MniI ; > < NlaIII 
GAGTAGTATT GATGCTTTCA AGCTTAACAT TAAGTTGTTG GGTATTGGAG GTAAACCATG TATCAAGGTT 
11700 11710 11720 11730 11740 11750 11760 
>< Vnel 
>< Snol 
>< Sdul 
>< NspII 
>< HgiAl 
>< Bspl286i 
>< BmyI >< Rsal 
>< Rsal >< ApaLI >< MboIt 
>< Cspé6éI >< Alw44I >< Cspél DdeI > 
>< Afal >< MaelIl >< Alw21I >< Afal BfrI > 
GCTACTGTAC AGTCTAAAAT GTCTGACGTA AAGTGCACAT CTGTGGTACT GCTCTCGGTT CTTCAACAAC 
11770 11780 11790 11800 11810 11820 11830 


>< NspII> < RsaI 


>< DralIIlI 
>< Sdul>< Csp6éI 
>< MboII >< Bspl286I 
>< HinfI >< Plel >< Bmyl > < Afal >< MboII 
TTAGAGTAGA GTCATCTTCT AAATTGTGGG CACAATGTGT ACAACTCCAC AATGATATTC TTCTTGCAAA 
11840 11850 11860 11870 11880 11890 11900 
>< TtChHBsT 
>< TaqI SfcI >< 
>< HindIII >< MboII >< NlalIti 
>< Alul > < EcodSTI >< BspWI AccI >< 
AGACACAACT GAAGCTTTCG AGAAGATGGT TICTCTTTTG TCTGTTTTGC TATCCATGCA GGGTGCTGTA 
11910 11920 - 11930 11940 11950 11960 11970 
>< VspI 
>< Tru9I > < Ksp632I 
>< Msel >< TtrhHBsI > < Earl 
>< AsnI >< TaqIl >< MboII > < Eaml11041 
>< AseI>< MnlI >< BegI/a >< Eco57I >< EcoS7I >< BegI 
GACATTAATA GGTTGTGCGA GGAAATGCTC GATAACCGTG CTACTCTTCA GGCTATTGCT TCAGAATTTA 
11980 11990 12000 12010 12020 12030 12040 
>< Stul 
>< SerFI 
>< Pall 
>< MvaI>< Haelll 
>< EcoRII>< Ecol47I 
>< Ecll36I 
>< DsaV >< BsuRI 
>< BstOl 
>< BstNI 
>< BspWI 
>< BsiLI 
>< Fnu4HI >< BsaJI >< BshI TFiI >< 
>< NdeI >< BspWI>< MnlI >< BalI >< SfcI Hinfl >< 
>< Acil >< ApyI>< AatI > < Alul 
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GTTCTTTACC ATCATATGCC GCTTATGCCA CTGCCCAGGA GGCCTATGAG CAGGCTGTAG CTAATGGTGA 


12050 12060 12070 12080 12090 12100 12110 
>< Xmni >< Tru9l >< SfaNI 
>< Hpht >< Msel >< Ddel 
>< Asp700I >< Ecods7i >< BbvI Fnu4HI >< 
TTCTGAAGTC GTTCTCAAAA AGTTAAAGAA ATCTTTGAAT GTGGCTAAAT CTGAGTTTGA CCGTGATGCT 
12120 12130 12140 12150 12160 12170 12180 
XholI >< 
Sau3AI >< 
NdeII >< 
Mn1lI > 
>< MnlI 
>< MfLI 
> < Sau3AI >< Mbol 
> < NdeIL DpniI >< 
> < Mbol DpnI >< 
> < DpnilI DdeI >< 
>< Dpnt BstYI >< 
>< BspWI >< RsaIBspAI >< 
> < BspAI >< CspOIBspl43I >< 
>< NlalII >< Bsp1l43I >< AfalBglII >< 
GCCATGCAAC GCAAGTTGGA AAAGATGGCA GATCAGGCTA TGACCCAAAT GTACAAACAG GCAAGATCTG 
12190 12200 12210 12220 12230 12240 12250 
>< Spel >< Ksp632I > < HindIIl 
>< Rmal >< DdeI >< SfaNI 
>< Maelit >< MbolII >< Eaml1104I >< BspWI 
>< Maer >< BspwWI >< EarI>< BfrI >< Alul 
AGGACAAGAG GGCAAAAGTA ACTAGTGCTA TGCAAACAAT GCTCTTCACT ATGCTTAGGA AGCTTGATAA 
12260 12270 12280 12290 12300 12310 12320 
>< Thal 
>< Mvyni 
>< HinPlI 
>< Hin6I 
>< Hhal 
>< Cfol 
>< BstUl 
>< Trudt >< Bsp5or 
>< Msel >< AccIifi SfeI >< 
TGATGCACTT AACAACATTA TCAACAATGC GCGTGATGGT TGTGTTCCAC TCAACATCAT ACCATTGACT 
12330 12340 12350 12360 12370 12380 12390 
>< Rsal 
>< NlaIv 
>< Eco64l 
>< Cspé6lI 
>< BslI 
>< BsiYI>< KpnI 
>< BscBI 
>< Bant 
>< Asp718 
>< Nlalil >< Afal 
>< BstXxI >< AccBII >< MaeIIl 
>< FnudHhTt >< BovIl >< Accé65I BsgI >< 
ACAGCAGCCA AACTCATGGT TGTTGTCCCT GATTATGGTA CCTACAAGAA CACTTGTGAT GGTAACACCT 
12400 12410 12420 12430 12440 12450 12460 
>< Zsp2t 
>< PpuldI 
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>< Nsil 
>< Mph11031I 
>< NdeI>< EcoT22I DdeI >< 
>< AvalII >< Sfanti >< SfaNnI >< Acil BfrfI >< 
TTACATATGC ATCTGCACTC TGGGAAATCC AGCAAGTTGT TGATGCGGAT AGCAAGATTG TTCAACTTAG 
12470 12480 12490 12500 12510 12520 12530 
>< Pall 
>< Haelil >< MnlI >< DdeIDdeI >< 
>< Tru9I>< NlalII >< BsuRI >< MaeIIt >< BspWI 
>< MseI>< HphtI > < XemI>< BshI >< Alul BspWI >< 
TGAAATTAAC ATGGACAATT CACCAAATTT GGCTTGGCCT CTTATTGTTA CAGCTCTAAG AGCCAACTCA 
12540 12550 12560 12570 12580 12590 12600 
RsaI >< 
NlalV >< 
KpnI >< 
>< Fnu4hi 
Eco6é4I >< 
Csp6I >< 
>< Truglt BscBI >< 
>< Pvull Asp718 >< 
>< Psp5SI AfaI >< 
>< NspBII >< AciI>< BanI 
>< Msel >< HinfI >< Plel AccBlI >< 
>< AluI > < SfcI >< Ddel>< BsrI >< PshAL Acc65I >< 
GCTGTTAAAC TACAGAATAA TGAACTGAGT CCAGTAGCAC TACGACAGAT GTCCTGTGCG GCTGGTACCA 
12610 12620 12630 12640 12650 12660 12670 
>< TthHBst 
>< TagI 
>< Sful 
>< Nspv 
>< MnlI 
>< Lspl 
>< Csp45I 
>< BstBI 
>< Rsal >< Bspl19I 
>< Cspélr >< BsiCI 
>< Alul >< BpuldlI 
>< Afar >< Asull 
CACAAACAGC TTGTACTGAT GACAATGCAC TTGCCTACTA TAACAATTCG AAGGGAGGTA GGTTTGTGCT 
12680 12690 12700 12710 12720 12730 12740 
>< XholI 
>< Sau3AI 
>< NdellI 
>< Mf1lI 
>< Mbofl 
>< Dpnit 
>< Dpnt 
>< BstYI >< TET >< Rsal 
>< BspAI >< Rmal >< Cspél 
>< Bsp143I >< HinfI >< Csp6I>< Rsal 
>< BglII >< Mael >< DdelI >< Afal>< Afal 
GGCATTACTA TCAGACCACC AAGATCTCAA ATGGGCTAGA TTCCCTAAGA GTGATGGTAC AGGTACAATT 
12750 12760 12770 12780 12790 12800 12810 
>< Sau96r 
>< PssI 
>< Pall 
>< NspIv 
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TACACAGAAC 
12820 


ACTTCATCAA 
12890 


TCAGGCTGGA 
12960 


CCTGCTAAAG 
13030 


>< Rsal 
>< MboII 
>< Csp6t 
>< Afal 
GTACACACAC 
13100 


TGGTGCTTCA 
13170 


> 


>< 

> 
AAAGGTAAGT 
13240 
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>< HaelIII 
>< Ecod1l09I 
>< DraIl 
>< Cfrl3i 
>< BsuRI 
>< Nlalv >< BsiZI RsaI > 
>< BsrI >< BshI Csp6I >< 
>< BscBI > < MaelIi >< Asul Afal > 
TGGAACCACC TTGTAGGTTT GTTACAGACA CACCAAAAGG GCCTAAAGTG AAATACTTGT 
12830 12840 12850 12860 12870 12880 
>< SfclI 
> < MbollI 
MaeII >< 
>< Fnu4dHI >< Rsal 
>< EcoS7I >< CspéI 
>< Trugl > < BbsI 
>< MseI >< MnlT >< BbvI >< Alul >< Afal 
AGGCTTAAAC AACCTAAATA GAGGTATGGT GCTGGGCAGT TTAGCTGCTA CAGTACGTCT 
12900 12910 12920 12930 12940 12950 
>< Rsal 
>< SfcI >< Cspé6éI 
>< BspwWE >< Afal >< BspMI AccI >< 
AATGCTACAG AAGTACCTGC CAATTCAACT GTGCTTTCCT TCTGTGCTTT TGCAGTAGAC 
12970 12980 12990 13000 13010 13020 
>< Rmal 
>< MnlI 
>< Mael >< Hphti 
CATATAAGGA TTACCTAGCA AGTGGAGGAC AACCAATCAC CAACTGTGTG AAGATGTTGT 
13040 13050 13060 13070 13080 13090 
>< Sint 
>< Saug6I 
>< NspIv 
>< NspHII 
>< NlalII 
>< Ecod7I 
>< Eam1l1l05I 
>< Cfrl3I 
>< Rsal >< Bsi2t 
>< CspéI >< Bmel8I >< XcemI 
>< BsrIl >< Avall PleI >< 
>< Afal >< MaelfI >< AluI >< Asul> < Hinfl 
TGGTACAGGA CAGGCAATTA CTGTAACACC AGAAGCTAAC ATGGACCAAG AGTCCTTTGG 
13110 13120 13130 13140 13150 13160 
>< TIL 
>< Sfani >< MaelItr 
>< NlalIit >< FokI >< HinfI 
TGTTGTCTGT ATTGTAGATG CCACATTGAC CATCCAAATC CTAAAGGATT CTGTGACTTG 
13180 13190 13200 13210 13220 13230 
< Rsal 
>< MaelII 
Csp6I >< Ddel 
< Afal >< BsrIi >< BfrI 
ACGTCCAAAT ACCTACCACT TGTGCTAATG ACCCAGTGGG TTTTACACTT AGAAACACAG 
13250 13260 13270 13280 132930 13300 
>< Thal 
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>< SfaNI 
>< MvnI 
>< BstUI 
>< Rsal >< BspSOor 
>< Cspé6élL >< Acil 
>< AfaI >< Acil >< Sfcl >< MaelItI >< AccliSfaNiI >< 
TCTGTACCGT CTGCGGAATG TGGAAAGGTT ATGGCTGTAG TTGTGACCAA CTCCGCGAAC CCTTGATGCA 
13310 13320 13330 13340 13350 13360 13370 
>< Zsp2i 
> < SfaNr 
>< Mph1103I>< Tru9I 
>< Ppul0I>< MaeII Fnu4HI >< 
>< NsiI> < FokI BsgI >< 
>< EcoT22I >< Msel >< BbvI 
>< Acil>< AvalIl >< Dral >< Acil >< Fnu4HI AcilI >< 
GTCTGCGGAT GCATCAACGT TTTTAAACGG GTTTGCGGTG TAAGTGCAGC CCGTCTTACA CCGTGCGGCA 
13380 13390 13400 13410 13420 13430 13440 
>< Spel 
>< Scal 
>< Rsal 
>< Rmal 
>< Mael 
> < Csp6I >< SfcI >< BspWI 
>< BspWI >< Afal >< AccI >< Begl/a BogI > 
CAGGCACTAG TACTGATGTC GTCTACAGGG CTTTTGATAT TTACAACGAA AAAGTTGCTG GTTTTGCAAA 
13450 13460 13470 13480 13490 13500 13510 
>< ScerFt 
>< Mval 
>< MnlI 
>< EcoRII 
>< Ecll36I 
>< Bstorl 
>< Bstnt 
>< BslI 
>< Dsav >< BsiYI 
>< BsiLI >< Plel 
>< Apyl > < FokI >< HinflI 
GTTCCTAAAA ACTAATTGCT GTCGCTTCCA GGAGAAGGAT GAGGAAGGCA ATTTATTAGA CTCTTACTTT 
13520 13530 13540 13550 13560 13570 13580 
>< NlaIII 
>< Ksp632I 
>< Earl 
>< Tru9l >< Eamllodi 
>< Msel >< BsmAI >< Trudl 
>< MnlI >< Alw261 >< Mboll >< Msel 
GTAGTTAAGA GGCATACTAT GTCTAACTAC CAACATGAAG AGACTATTTA TAACTTGGTT AAAGATTGTC 
13590 13600 13610 13620 13630 13640 13650 
>< Rsal 
>< Nlaiv 
> < NlalIf 
>< KpnI 
>< HphI 
> < Eco64I 
>< Cspé6f 
>< BscBI 
> < Banl 
> < Asp718 
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>< MaelII >< Afal 


>< NspBIT > < AccBlI MaeII >< 
>< Acil >< NlaIIt > < Acc65I > < Hgal 
CAGCGGTTGC TGTCCATGAC TITTTCAAGT TTAGAGTAGA TGGTGACATG GTACCACATA TATCACGTCA 
13660 13670 13680 13690 13700 13710 13720 
>< Mn1lI 
>< MaelIt 
GCGTCTAACT AAATACACAA TGGCTGATTT AGTCTATGCT CTACGTCATT TTGATGAGGG TAATTGTGAT 
13730 13740 13750 13760 13770 13780 13790 
>< Tru9I 
>< Msel >< MaeIII >< Munl 
ACATTAAAAG AAATACTCGT CACATACAAT TGCTGTGATG ATGATTATTT CAATAAGAAG GATTGGTATG 
13800 13810 13820 13830 ‘13840 13850 13860 
>< Thal 
>< MvnI 
>< MLlul 
>< BstUL >< Rsal 
>< Bsp5OI >< Hphi 
>< T£LiT >< Af1III >< DdeI >< Csp6I Tru9I >< 
>< Hinfl >< AccIilL >< Bférl >< Afal MseI >< 
ACTTCGTAGA GAATCCTGAC ATCTTACGCG TATATGCTAA CTTAGGTGAG CGTGTACGCC AATCATTATT 
13870 13880 13890 13900 13910 13920 13930 
XhoII > 
Sau3AI > 
NdeII > 
MflI > 
> < SfaNI >< Rsal MboI > 
>< Rsal > < Csp6I DpniI > 
>< Cspé6éI >< BspWI BstYI > 
>< Afal >< Sfani >< Afal BspAI > 
AAAGACTGTA CAATTCTGCG ATGCTATGCG TGATGCAGGC ATTGTAGGCG TACTGACATT AGATAATCAG 
13940 13950 13960 13970 13980 13990 14000 
> < ScrfI 
> < Mval 
>< Fnu4dL 
>< EcoRII 
> < Ecli361 
> < BstOIr 
> < BstNI 
>< TruSl >< Rsal >< BslI 
>< Msel >< Rsal > < Hpht >< BsiYI 
>< Dpni >< Csp6I >< Cspél > < BsiLl 
>< Bsp143I >< BsrI > < BbhvI > < ApyI 
>< AlwI >< Afal >< Afal >< DsaV >< Acil 
GATCTTAATG GGAACTGGTA CGATTTCGGT GATTTCGTAC AAGTAGCACC AGGCTGCGGA GTTCCTATTG 
14010 14020 14030 14040 14050 14060 14070 
>< SfaNI 
>< Rmal > < Hinft 
>< MamI >< Mn1li >< Fnu4HIPleI >< 
>< TET >< SfaNtI >< BsiBI >< Mael >< Ddel 
>< Hinfl >< FokI >< BsaBI >< BbvI >< BspWI NdeI >< 
TGGATTCATA TTACTCATTG CTGATGCCCA TCCTCACTTT GACTAGGGCA TTGGCTGCTG AGTCCCATAT 
14080 14090 14100 14110 14120 14130 14140 
>< Sau3Al 
>< NdeII 
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>< Mbol 
>< Mami 
>< DpnIl TthiLili o< 
>< Dpni MboII >< 
>< BspwWI >< Ksp632I1 
>< BspAI >< Eam11041 
>< Bsp143I >< Kemi >< BsmAl 
>< BsiBI >< Tru9I >< Earl AspI >< 
>< BsaBI >< FokI >< Msel >< Alw26I 
GGATGCTGAT CTCGCAAAAC CACTTATTAA GTGGGATTTG CTGAAATATG ATTTTACGGA AGAGAGACTT 
14150 14160 14170 14180 14190 14200 14210 
> < Sinl 
> < Saug6l 
> < NspIv 
>< NsSpHITI 
>< TChHBsl >< Nlaliv 
>< TaqI >< Foktr 
>< McrI > < Eco47I 
> < Ksp632I1 > < Cf£r13I 
> < Earl > < BsiZI 
> < Eam11l04I >< Sspi>< BscBI 
>< BsmAI > < Tru9l > < Bmei8I 
>< MbolII >< BsiEI> < MseIL > < Avall >< Trugl 
>< Alw26I >< DraI > < Asul >< MunI >< Msel 
TGTCTCTTCG ACCGTTATTT TAAATATTGG GACCAGACAT ACCATCCCAA TTGTATTAAC TGTTTGGATG 
14220 14230 14240 14250 14260 14270 14280 
Sinl >< 
Sau96I >< 
NspIV >< 
NspHITI > 
Eco47I >< 
Cfr13I >< 
BsiZI >< 
Bmel8I >< 
>< Tru9l AvaII >< 
>< FokI >< Msel AsulI >< 
ATAGGTGTAT CCTTCATTGT GCAAACTTTA ATGTGTTATT TTCTACTGTG TTTCCACCTA CAAGTTTTGG 
14290 14300 14310 14320 14330 14340 14350 
>< Spel 
>< Rmal 
>< Mael >< SspI >< BsrI 
ACCACTAGTA AGAAAAATAT TTGTAGATGG TGTTCCTTTT GTTGTTTCAA CTGGATACCA TITTCGTGAG 
14360 14370 14380 14390 14400 14410 14420 
>< Thal>< Esp3I 
>< Ddel 
>< BstUL 
>< Rsal >< Bsp50I >< BsmBI 
>< HinfI >< PleI >< MvnI>< BsmAI 
> < Csp6r >< Hgal>< AluTl >< Alw26I 
>< Afal >< FokI >< AccIil > < BbvI 
TTAGGAGTCG TACATAATCA GGATGTAAAC TTACATAGCT CGCGTCTCAG TTTCAAGGAA CTTTTAGTGT 
14430 14440 14450 14460 14470 14480 14490 
>< Zsp2i 
>< Spht 
>< PpuldI 
>< Pael 
>< Nspti 
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>< Sau3AlI >< NspHI 
>< NdelI >< Nsil 
>< Mbol >< NlaIII 
>< Dpnit >< Mph1103I1 >< NspI 
> < Dpni >< Fnu4HI NspHI >< 
>< Fnu4HI>< BspwWI >< EcoT22I NlaIII >< 
>< BspAI >< BspwWI >< BspWI 
> < Bsp1l43I> < AvaIII > < AlwNI >< RmalI ~ >< BsgI 
>< AlwI >< Alul >< AluI >< BbvI >< Mael >< Bbvi 
ATGCIGCTGA TCCAGCTATG CATGCAGCTT CTGGCAATTT ATTGCTAGAT AAACGCACTA CATGCTTTTC 
14500 14510 14520 14530 14540 14550 - 14560 - 
>< SerFI 
>< Neil 
>< MspI 
>< Hpail 
>< Fnu4Hl >< HapIt 
>< AlwNI >< DsaV >< Trud9l 
>< Alul >< BenI >< Msel 
AGTAGCTGCA CTAACAAACA ATGTTGCTTT TCAAACTGTC AAACCCGGTA ATTTTAATAA AGACTTTTAT 
14570 14580 14590 14600 14610 14620 14630 
>< Trudt DdeI >< 
>< Msel >< MbolII BbvI >< 
GACTTTGCTG TGTCTAAAGG TTTCTTTAAG GAAGGAAGTT CTGTTGAACT AAAACACTTC TTCTTTGCTC 
14640 14650 14660 14670 14680 14690 14700 
>< Fokl EcoRV >< 
>< FEnu4HI Eco32I >< 
AGGATGGCAA CGCTGCTATC AGTGATTATG ACTATTATCG TTATAATCTG CCAACAATGT GTGATATCAG 
14710 14720 14730 14740 14750 14760 14770 
>< VspI 
>< Tru9Il 
>< Msel 
>< AsnI 
>< MaellI >< Asel 
ACAACTCCTA TTCGTAGTTG AAGTTGTTGA TAAATACTTT GATTGTTACG ATGGTGGCTG TATTAATGCC 
14780 14790 14800 14810 14820 14830 14840 
>< Truglt 
>< Msel >< Pvull 
>< Hpal >< Psp5SI > < XcmI 
>< HindII : >< NspBIT >< Trudgl RmaI >< 
>< HinclIl >< ALul >< Msef Mael >< 
AACCAAGTAA TCGTTAACAA TCTGGATAAA TCAGCTGGTT TCCCATTTAA TAAATGGGGT AAGGCTAGAC 
14850 14860 14870 14880 14830 14900 14910 
>< SfaNtI >< Thal 
>< Sau3AL >< Mvnl 
>< NdeII >< BstUI 
>< Mbol >< Bst11071 
>< Dpnil >< BspWI >< FokI 
>< Dpnl >< Bspsor 
>< Plel >< Bspl143I >< AccII>< Ddel 
>< HinfI>< MnlI >< BspAI >< AlwI >< Accl 
TTTATTATGA CTCAATGAGT TATGAGGATC AAGATGCACT TTTCGCGTAT ACTAAGCGTA ATGTCATCCC 
14920 14930 14940 14950 14960 14970 14980 
>< SstI 
>< Sdul 
>< Sacti 
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>< NspIit 
>< HgiAl 
>< Eco24I 
>< Tru > < Ecli36II 
>< TET >< Bsp12861 
>< Msel >< Bmyl 
>< HinfI >< BaniI 
> < Esp4t >< Alw21I 
> < AflII >< BspwiI > < Alul >< Alul 
TACTATAACT CAAATGAATC TTAAGTATGC CATTAGTGCA AAGAATAGAG CTCGCACCGT AGCTGGTGTC 
14990 15000 15010 15020 15030 15040 15050 
RmaI >< 
>< Scal > < MnlI 
>< SfcI>< Rsal MaeI >< 
>< BsmAL >< Csp6Tt >< FnuAHI 
>< Alw26I >< Afal >< Acil 
TCTATCTGTA GTACTATGAC AAATAGACAG TTTCATCAGA AATTATTGAA GTCAATAGCC GCCACTAGAG 
15060 15070 15080 15090 15100 15110 15120 
>< Tru9l 
>< Alul >< Msel 
GAGCTACTGT GGTAATTGGA ACAAGCAAGT TTTACGGTGG CTGGCATAAT ATGTTAAAAA CTGTTTACAG 
15130 15140 15150 15160 15170 15180 15190 
NspI >< 
NspHI >< 
NlaIII >< 
>< NlaIlit 
DdeI >< 
BspWI >< 
>< MaelIit Bfrt >< 
TGATGTAGAA ACTCCACACC TTATGGGTTG GGATTATCCA AAATGTGACA GAGCCATGCC TAACATGCTT 
15200 15210 15220 15230 15240 15250 15260 
> < Pall 
> < HaeIII 
> < BsuRI 
> < BshI >< Mnil ; >< MaeLllIt SfcI >< 
AGGATAATGG CCTCTCTTGT TCTTGCTCGC AAACATAACA CTTGCTGTAA CTTATCACAC CGTTTCTACA 
15270 15280 15290 15300 15310 15320 15330 
Tru9I >< 
SerFI > 
MvaI > 
>< Msel 
>< MstI FokI >< 
>< HinPlIi EcORIT >< 
>< HinéI Ecl136I > 
> < Hhal DsaV >< 
>< Fspl BstOI > 
>< Fdill >< NlaiII BstNI > 
> < CfolI>< Trugl > < Fnu4HI BsiLI > 
>< Alul >< AvillI >< MseI >< Acil ApyI > 
GGTTAGCTAA CGAGTGTGCG CAAGTATTAA GTIGAGATGGT CATGTGTGGC GGCTCACTAT ATGTTAAACC 
15340 15350 15360 15370 15380 15390 15400 
> < SfaNI 
>< Mspti 
>< HpaII >< HphI >< Tru9I MaelIII >< 
>< HapIl >< BspWI >< Msel AlulI >< 
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AGGTGGAACA TCATCCGGTG ATGCTACAAC TGCTTATGCT 


15410 


>< BspwWI 
ACAGCCAATG 
15480 


AACACAGGCT 
15550 


TTACCTGCGT 
15620 


>< EFnudklI 

>< Acil 

GCGGCTCAAG 
15690 


>< NlalIi 
>< Ddel 
TGTCTGAGGC 
15760 


15420 


TAAATGCACT 
15490 


CTATGAGTGT 
15560 


>< BspMI 
AAACATTTCT 
15630 


> 

>< 

> 

>< 
GTTTAGTAGC 
15700 


15430 15440 


TCTTTCAACT GATGGTAATA 
15500 15510 


>< SfcI > 
>< BsmAI > 

>< Alw26I 
CTCTATAGAA ATAGGGATGT 
15570 15580 


>< TELIT 
>< SfaNI 
>< NlalIil 
>< Hinfl 
CCATGATGAT TCTTTCTGAT 
15640 15650 


< Rmal 

NheI >< Tru9I 

< MaelI 

AluI >< Msei 

TAGCATTAAG AACTTTAAGG 
15710 15720 


>< Ddel 


>< BsmAI 
>< Alw26I 
AAAATGTTGG ACTGAGACTG ACCTTACTAA AGGACCTCAC GAATTTTGCT CACAGCATAC 


15770 


15780 15790 


AATAGTGTCT TTAACATTTG TCAAGCTGTT 
15450 15460 15470 


>< OrdIt 
>< Alul > < Acil 
AGATAGCTGA CAAGTATGTC CGCAATCTAC 
15520 15530 15540 


>< Sau3AI 
>< NdeII 
>< Mbor 
< MamI 

>< Foal 
>< DpnIl 

>< Dpni 

>< BspHI 

>< BspAI 

>< Bspl43I 
>< Bsigl 
< BsiBI>< NlalII 
< BsaBI>< FoklI 
>< BelI>< EcoRI FokI >< 
TGATCATGAA TTCGTGGATG AGTTTTACGC 

15590 15600 15610 


>< MaelItr 
GATGCCGTTG TGTGCTATAA CAGTAACTAT 
15660 15670 15680 


>< Tru9l 
>< Msel 


Mn1lI >< 
CAGTTCTTTA TTATCAAAAT AATGTGTTCA 
15730 15740 15750 


>< Sinl 

>< Sau96I 
>< PssI 

>< Psp5SII 

>< PpuMI 

>< Nspiv 

>< NspHIT 

>< Eco0109I 

>< Eco47I 

>< DraII 

>< Cfri3I 

>< BsiZI 

>< Bmel8I 

>< Avall 

>< Asul >< Mn1lI 


15800 15810 15820 
>< XholI 

>< Sau3Al 

>< NdeII 

>< Mf1LI 


>< Mbol 
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>< Rsal >< DpniI 
>< Maell >< Dpni > < Sspt 
>< Trugl >< Csp6I >< BstYI HinP1lI >< 
>< Rmal >< BsaAl >< BspMI Hin6I >< 
>< Mael >< AFLIIL >< BspAL HhalI >< 
>< BspWI>< MseI >< Afal >< AlwI>< Bspl43L Cfol >< 
AATGCTAGTT AAACAAGGAG ATGATTACGT GTACCTGCCT TACCCAGATC CATCAAGAAT ATTAGGCGCA 
15830 15840 15850 15860 15870 15880 15890 
>< Rsal >< SfaNt 
>< TChHBeTr >< Cspé6r >< MaeITI 
>< TaqI >< Afal BsrI >< 
GGCTGITTTG TCGATGATAT TGTCAAAACA GATGGTACAC TTATGATTGA AAGGTTCGTG TCACTGGCTA 
15900 15910 15920 15930 15940 15950 15960 
> < FokI 
>< BspWI 
TTGATGCTTA CCCACTTACA AAACATCCTA ATCAGGAGTA TGCTGATGTC TTTCACTTGT ATTTACAATA 
15970 15980 15990 16000 16010 16020 16030 
>< Van91lt 
>< P£LMI 
>< NspI 
> < PalI>< NspHI 
> < Msci>< NlalIit 
> < HaeLlII 
> < BsuRI 
>< BsrIi 
>< Eael >< BslI >< Nspt 
> < BshI>< BsiYI >< NspHI 
>< NlaLlIt >< AfLIILT >< AfLILI 
>< MaellI >< Alul > < BalI>< AccB7I >< Nilalll 
CATTAGAAAG TTACATGATG AGCTTACTGG CCACATGTTG GACATGTATT CCGTAATGCT AACTAATGAT 
16040 16050 16060 16070 16080 16090 16100 
>< Rsal> < Nlalv 
>< Mnit 
>< Cspél >< Ddel >< Rsal 
>< BsrI >< MnlI >< Csp6r 
>< Afal> < BscBI >< Afal SfcI >< 
RACACCTCAC GGTACTGGGA ACCTGAGTTT TATGAGGCTA TGTACACACC ACATACAGTC TTGCAGGCTG 
16110 16120 16130 16140 16150 16160 16170 
>< Nlalv 
>< EcoNI 
>< Eco31t 
>< Eco64I>< BsmALT 
>< BscBI >< BslI 
>< BanI >< BsiYI 
>< Acil >< Bsal 
>< BspwWI >< AccBlI>< Alw26I BbvI >< 
TAGGTGCTTG TGTATTGTGC AATTCACAGA CTTCACTTCG TTGCGGTGCC TGTATTAGGA GACCATTCCT 
16180 16190 16200 16210 16220 16230 16240 
>< Tthl1li 
>< Fnu4kt >< Nlalil > < Tru9l 
>< BspWI >< AspI > < Msel 
ATGTTGCAAG TGCTGCTATG ACCATGTCAT TTCAACATCA CACAAATTAG TGTTGTCTGT TAATCCCTAT 
16250 16260 16270 16280 16290 16300 16310 
>< ScrFl 
>< Mval 
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>< EcoRII 
>< Ecll36I1 
>< DsaVv 
>< BstOL 
>< BstNnI 
>< BsiLI >< Rmal 
>< BsaJI >< Mnit BspWI >< 
>< ApylI >< MaeIII >< MaeIri >< Mael >< Alul 
GTTTGCAATG CCCCAGGTTG TGATGTCACT GATGTGACAC AACTGTATCT AGGAGGTATG AGCTATTATT 
16320 16330 16340 16350 16360 16370 16380 
>< MaelII >< Mnli 
GCAAGTCACA TAAGCCTCCC ATTAGTTTTC CATTATGTGC TAATGGTCAG GTTTTTGGTT TATACAAAAA 
16390 16400 16410 16420 16430 16440 16450 
>< Nspti >< Nspli 
>< NspHI > < Tthlllit >< NspHI 
>< NlaIII>< MaeIII>< MaelIIiI >< NlaIIt 
>< AFLIII >< Aspr >< AF1LIITI 
CACATGTGTA GGCAGTGACA ATGTCACTGA CTTCAATGCG ATAGCAACAT GTGATTGGAC TAATGCTGGC 
16460 16470 16480 16490 16500 16510 16520 
>< RsaI 
>< Plel 
>< Ddel 
>< Cspét 
>< BsmAI >< HinfI >< Molt 
>< Alw261 >< HindIIt DdeI >< 
>< Afal >< AluI >< Fnu4HI >< BbvI 
GATTACATAC TTGCCAACAC TTGTACTGAG AGACTCAAGC TTTTCGCAGC AGAAACGCTC AAAGCCACTG 
16530 16540 16550 16560 16570 16580 16590 
> < Thal 
>< Scal 
>< Rsal >< Rsal 
> < Muni 
>< Csp6l >< Cspé6I 
> < BstUL 
> < Trugl > < BspSsorl 
> < Msel > < Ndel >< Afal >< Afal 
>< Alut > < AccilI MnlI > 
AGGAAACATT TAAGCTGTCA TATGGTATTG CCACTGTACG CGAAGTACTC TCTGACAGAG AATTGCATCT 
16600 16610 . 16620 16630 16640 16650 16660 
MaelII >< 
>< MaeIII 
>< Ecod651 
>< Eco9lI 
>< BstPI 
>< SfaNI >< Rmal >< BstEII 
>< NlaIitl >< Mael >< BsrI 
TTCATGGGAG GTTGGAAAAC CTAGACCACC ATTGAACAGA AACTATGTCT TTACTGGTTA CCGTGTAACT 
16670 16680 16690 16700 16710 16720 16730 
RsaI >< 
>< Mn1lI 
>< Rsal >< Rsal >< Hphi 
>< Cspot >< Cspél >< SfaNI Csp6I >< 
>< Afar >< Afal >< MaelIil >< Hphr AfalI >< 
AAAAATAGTA AAGTACAGAT TGGAGAGTAC ACCTTTGAAA AAGGTGACTA TGGTGATGCT GTTGTGTACA 
16740 16750 16760 16770 16780 16790 16800 
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>< Rsal >< Hphti 
>< Cspél . >< HindIit DdeI >< 
>< Afal >< HincII Bfrl >< 
GAGGTACTAC GACATACAAG TTGAATGTTG GTGATTACTT TGTGTTGACA TCTCACACTG TAATGCCACT 
16810 16820 16830 16840 16850 16860 16870 
>< Vnel 
>< Snol 
>< Sdul 
>< NspIil 
>< HgiAl > < Sdul 
>< DralIII > < NspIt 
>< Bspl28éI > < HgiATI 
>< Bmyl >< BspWI >< DralII >< Rsal 
>< ApaLl >< Rmal > < Bsp1286I >< Csp6l 
>< Alw44T >< Mael > < Bmyl >< BsrI 
>< Alw21lI > < Alw211 >< Afal DdeI > 
TAGTGCACCT ACTCTAGTGC CACAAGAGCA CTATGTGAGA ATTACTGGCT TGTACCCAAC ACTCAACATC 
16880 16890 16900 16910 16920 16930 16940 
StyI >< 
SinI > 
Sau96I > 
NspIv > 
EcoTl1l4I >< 
Eco47I > 
Eco1l30I >< 
>< ScaI Cfrl3I > 
BssT1lI >< 
>< SphiI >< Rsal BsizI > 
>< Pael BsaJI >< 
>< NlaIitI Bmel8I > 
>< Rmal >< NspI>< Csp6i AvalIlI > 
>< Mael >< NspHI>< Afal Asul > 
TCAGATGAGT TTTCTAGCAA TGTTGCAAAT TATCAAAAGG TCGGCATGCA AAAGTACTCT ACACTCCAAG 
16950 16960 16970 16980 16990 17000 17010 
>< Scrkl 
>< Rsal 
>< Mval 
>< EcoRI! 
>< Ecll36. 
> < Cspé6r 
>< Bstol 
>< BstNI 


>< Xemir >< BslI 
>< NspHIT >< BsiYI 
>< BsiLI 
>< ApylI >< BsrI 
>< DsaV>< AfaIl > < HinfI>< Plel 
GACCACCTGG TACTGGTAAG AGTCATTTTG CCATCGGACT TGCTCTCTAT TACCCATCTG CTCGCATAGT 


17020 * 17030 17040 17050 ~ 17060 17070 17080 
>< SfaNnI 
>< Sphi >< Pvull 
>< Pael >< PspSI 
>< NsplI >< NspBIT 
>< NspHI >< Fnu4HI > < Tru9l 
>< Bst1llo7I > < NlaIlII>< BspWI >< Sspi 
>< Acct >< NlaIIif >< Alul >< BbvI > < Msel 
GTATACGGCA TGCTCTCATG CAGCTGTTGA TGCCCTATGT GAAAAGGCAT TAAAATATTT GCCCATAGAT 
17090 17100 17110 17120 17130 17140 17150 
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> < Thal 
>< Thal 
> < Muni 
>< MvniI >< Thal 
> < HinPLI 
>< HinPl1I 
>< HinPlI >< MvunI 
> < Hin6éI 
>< Hin6ét 
> < Hhal 
>< HhaI >< Hhal 
> < Cfol 
>< CfoI >< Cfol 
> < BstUL 
>< BstUI >< BstUL 
>< BssHII 
>< BspMI 
> < Bsp50I 
>< BspSOI>< Bsp50I RmaI > 
>< TELT >< Hin6I> < AccIt Mael > 
>< HinfI >< AccII >< AccII > < EcoRI 
AAATGTAGTA GAATCATACC TGCGCGTGCG CGCGTAGAGT GTTTTGATAA ATTCAAAGTG AATTCAACAC 
17160 17170 17180 17190 17200 17210 17220 
>< Zsp2T 
>< PpuldI 
>< Nsil 
>< Mph1l1031 
>< EcoT22I 
>< Bsgl : > < AvallIl >< DrdI 
TAGAACAGTA TGTTTTCTGC ACTGTAAATG CATTGCCAGA AACAACTGCT GACATTGTAG TCTTTGATGA 
17230 17240 17250 17260 17270 17280 17290 
>< Rmal 
>< Mael >< Maell 
AATCTCTATG GCTACTAATT ATGACTTGAG TGTTGTCAAT GCTAGACTTC GTGCAAAACA CTACGTCTAT 
17300 17310 17320 17330 17340 17350 17360 
>< Sau3AI 
>< Ndell 
>< Mbol 
>< Dpnit 
>< Dpnti : 
>< BspAI >< Rmal 
>< AlwI>< Bsp143I > < Acil >< MaeI SspI >< 
ATTGGCGATC CTGCTCAATT ACCAGCCCCC CGCACATTGC TGACTAAAGG CACACTAGAA CCAGAATATT 
17370 17380 17390 17400 17410 17420 17430 
>< SinI 
>< Sau96l 
>< Nspiv >< Styl 
>< NspHII >< Nsptr 
>< Eco47I >< NspHI 
>< Cfrl3I >< NlaIIt 
>< BsiZI >< EcoTl4it 
>< BsgL >< Ecol30I 
>< Bmel BI >< BssTII 
>< Trudl >< Avall >< BsaJI 
>< Msel >< AsuI> < AfLIII 
TTAATTCAGT GTGCAGACTT ATGAAAACAA TAGGTCCAGA CATGTTCCTT GGAACTTGTC GCCGTTGTCC 
17440 17450 17460 17470 17480 17490 17500 
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>< HindIil 
>< Hincif >< Alul 
TGCTGARATT GITTGACACTG ‘TGAGTGCTTT AGTTTATGAC AATAAGCTAA AAGCACACAA GGATAAGTCA 
17510 17520 — 17530 17540 17550 17560 17570 
>< Alul >< NlaIIil 
GCTCAATGCT TCAAAATGTT CTACAAAGGT GTTATTACAC ATGATGTTTC ATCTGCAATC AACAGACCTC 
17580 175390 17600 17610 17620 17630 17640 
>< Mnilt 
>< EcoNT 
>< BslI >< HphI 
>< BsiYI >< Alul 
AAATAGGCGT TGTAAGAGAA TTTCTTACAC GCAATCCTGC TTGGAGAAAA GCTGTTTTTA TCTCACCTTA 
17650 17660 17670 17680 17690 17700 17710 
>< SfcI >< Ddel >< TELI 
> < Alut >< Bfrt >< HinfIl 
TAATTCACAG AACGCTGTAG CTTCAAAAAT CTTAGGATTG CCTACGCAGA CTGITGATTC ATCACAGGGT 
17720 17730 47740 17750 17760 17770 17780 
> < HindIII 
>< Tthl1iltT > < HinclIi 
>< Aspti >< Acil 
TCTGAATATG ACTATGTCAT ATTCACACAA ACTACTGAAA CAGCACACTC TTGTAATGTC AACCGCTTCA 
17790 17800 17810 17820 17830 17840 17850 
>< XholII 
>< Sau3Al 
>< NdelII 
>< MELI 
>< Mbol 
>< Mami 
>< Dpniti 
>< DpnI 
>< BstYI 
>< BspAI 
>< Bspl431 
>< BsiBI 
>< BsaBlL 
>< BSpWI >< BgLII 
ATGTGGCTAT CACAAGGGCA AAAATTGGCA TTTTIGTGCAT AATGTCTGAT AGAGATCTTT ATGACAAACT 
17860 17870 17880 17890 17900 17910 17920 
>< Xbal 
>< Rmal >< MaeIIlI 
>< Mael >< MaeIL BsrI >< 
GCAATTTACA AGTCTAGAAA TACCACGTCG CAATGTGGCT ACATTACAAG CAGAAAATGT AACTGGACTT 
17930 17940 17950 17960 17970 17980 17990 
>< Sau3Al 
>< NdeII 
>< MbolII 
>< Mbol 
> < FokI 
>< Dpnit >< Nlalv 
>< Dpnl >< Ecoéal 
>< BspAI >< BscBI 
>< Trudi >< Bspl43I >< BantI Mn1lI >< 
>< MseI>< SfcI >< BbsI > < BsrI >< AccB1I >< Ddel 
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TTTAAGGACT GTAGTAAGAT CATTACTGGT CTTCATCCTA CACAGGCACC TACACACCTC AGCGTTGATA 
18000 18010 18020 18030 18040 18050 18060 


>< ScrFI 
>< Mval 
>< EcoRI 
>< Eco57I 
>< Ecll36I 
>< DsaV 
>< BstOIL 
>< BstNI 
>< HindII>< BsiLTt 


>< Plel 
>< NlalIIi 
HinfI >< 


>< HinclII>< ApyI AccI >< 
TAAAGTTCAA GACTGAAGGA TTATGTGTTG ACATACCAGG CATACCAAAG GACATGACCT ACCGTAGACT 


18070 18080 18090 18100 18110 18120 18130 
>< MaellIl Thal >< 
>< Ecooésl Mval >< 
>< Eco91f BstUI >< 
>< BstxI BspSOI >< 
>< BstPI >< Acil 
>< BstEILI >< HphI AccII >< 
CATCTCTATG ATGGGTTTCA AAATGAATTA CCAAGTCAAT GGTTACCCTA ATATGTTTAT CACCCGCGAA 
18140 18150 18160 18170 18180 18190 18200 
>< XmnI 
> < Mbolil >< SfaNI 
> < MaelII >< Rmal 
>< Asp700I >< NlalIII 
>< Alul >< MaeITI >< Mnil >< Mael 
GAAGCTATTC GTCACGTTCG TGCGIGGATT GGCITTGATG TAGAGGGCTG TCATGCAACT AGAGATGCTG 
18210 18220 18230 18240 18250 18260 18270 
>< Trudl 
>< Msel 
>< Rsal >< Hpal 
>< Gsul >< Rmal >< HindII >< Rsal 
>< CspélI >< Malt >< HinclII >< Cspol 
>< Bpmi >< Mael >< DdeI >< Alul BsrI >< 
>< Afal >< Alul >< SfcI >< BfrI >< Afalt 
TGGGTACTAA CCTACCTCTC CAGCTAGGAT TITCTACAGG TGTTAACTTA GTAGCTGTAC CGACTGGTTA 
18280 18290 18300 18310 18320 18330 18340 
>< ScrFI 
>< Mval 
>< Mali 
>< MaelIIl 
>< EcoRIit 
>< Ecod0651 
>< ECoONT 
>< Eco9l1I 
>< Ecll36I 
>< DsaV Tru9I >< 
>< Dralli 
>< BstPI 
>< BstoOl 
>< BstNI Pmel >< 
>< BstEII 
>< BslI MseI >< 
>< BsiYI HphI >< 
>< HindIII >< HphI >< Tru9I >< BsiLI DralI >< 
>< HinclI >< EcoRI >< Msel >< ApyI >< BsrI 
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TGTTGACACT GAAAATAACA CAGAATTCAC CAGAGTTAAT GCAAAACCTC CACCAGGTGA CCAGTTTAAA 


18350 18360 18370 18380 18390 18400 18410 
>< SerFI 
>< Mval 
?< EcoRII 
>< Ecl1361 
>< DsaV 
>< BstOl 
>< BstNI >< Rsal 
>< BsiLI DdeI >< 
>< BsaJI > < Tru9l>< Cspél 
>< NlaIIl >< ApyI > < MseI >< Afal 
CATCTTATAC CACTCATGTA TAAAGGCTTG CCCTGGAATG TAGTGCGTAT TAAGATAGTA CAAATGCTCA 
18420 18430 18440 18450 18460 - 18470 18480 
>< Nialil 
>< HinPlLI 
>< TthL11I >< Hin6i 
>< HinfI > < Hhal 
>< AspI >< Plel > < C£ol >< Alul 
GTGATACACT GAAAGGATTG TCAGACAGAG TCGTGTTCGT CCTTTGGGCG CATGGCTTTG AGCTTACATC 
18490 18500 18510 18520 18530 18540 18550 
>< Sinl 
>< Sau96i 
>< Nsplv 
>< NspHITI 
>< Eco471 
>< Cfrl3I 
>< Scal >< BsiZI 
>< Rsal >< Bmel8I 
>< Cspér >< Avall >< Maell 
>< Afal >< Asul >< AFLIII >< MaeIII>< MaelI 
AATGAAGTAC TTTGTCAAGA TIGGACCTGA AAGAACGTGT TGTCTGTGTG ACAAACGTGC AACTTGCTTT 
18560 18570 18580 18590 18600 18610 18620 
> < TEil ><. .TehLili 
> < HinfI > < Aspl 
TCTACTTCAT CAGATACTTA TGCCTGCTGG AATCATTCTG TGGGTTTTGA CTATGTCTAT AACCCATTTA 
18630 18640 18650 18660 18670 18680 18690 
>< SerFI 
RsaI >< 
>< Mval 
>< EcoRII 
Ecll36I >< 
>< DsaV 
Csp6I >< 
BstxXI >< 
> < MaelIII >< BstOL 
> < £co0651 >< BsENI 
> < Eco9lt >< BsiLI 
> < BstPI >< Apyl 
>< EcoS7I> < BstEII >< MaeIII >< NlalII AfaI >< 
TGATTGATGT TCAGCAGTGG GGCTTTACGG GTAACCTTCA GAGTAACCAT GACCAACATT GCCAGGTACA 
18700 18710 18720 18730 18740 18750 18760 
>< SfaNI 
>< Rmal 
>< NspI 
>< NspHI 


FIGURE 13.43 


259 


EP 1 694 829 B1 


>< NlaLII >< Rmal 
>< Mael >< NlalIt Tru9l >< 
>< NlaIII >< BspWI >< Mael >< NlaIfl 
> < AFLIIT >< BspHI MseI >< 
TGGABATGCA CATGTGGCTA GTTGTGATGC TATCATGACT AGATGTTTAG CAGTCCATGA GTGCTTTGTT 
18770" 18780 18790 18800 18810 18820 18830 
>< Thal 
>< Mvnt 
>< HinPlI 
>< Hin6I 
>< Ahal 
>< Cfol 
>< BstuUI >< EcoNI> < MnlI 
>< Bsp50I >< BslI >< Tru9l 
>< AccII >< BsiYI >< DdeI >< Msel 
AAGCGCGTTG ATTGGTCTGT TGAATACCCT ATTATAGGAG ATGAACTGAG GGTTAATTCT GCTTGCAGAA 
18840 18850 18860 18870 18880 18890 18900 
>< Rsal 
>< Cspé6él >< MboII > < NlalIfiI 
>< Afal >< Nlalil >< Bspwt >< BsrI >< BspHI 
AAGTACAACA CATGGTTGTG AAGTCTGCAT TGCTTGCTGA TAAGTTTCCA GTTCTTCATG ACATTGGAAA 
18910 18920 18930 18940 18950 18960 18970 
>< Saul 
>< MstIit 
>< Eco8sil 
>< Ddel Nlafift >< 
>< CvnI >< Espl 
>< Bsu361 >< Eco57I MaelII >< 
>< Bse21I >< Ddel 
>< Axyl >< CelllI 
>< Aocl >< MnlI >< SfaNt >< Bpulld2t 
TCCAAAGGCT ATCAAGTGTG TGCCTCAGGC TGAAGTAGAA TGGAAGTTCT ACGATGCTCA GCCATGTAGT 
18980 18990 19000 19010 19020 19030 19040 
>< MnilI >< Ksp632I 
>< HindiIilt >< Earl 
>< Alul >< MboII >< Eam1104I 
GACAAAGCTT ACAAAATAGA GGAACTCTTC TATTCTTATG CTACACATCA CGATAAATTC ACTGATGGTG 
19050 19060 19070 19080 19090 19100 19110 
>< Sau3AL 
>< NdelIl 
>< MbolI 
>< MaeII> < MaeIII 
>< Dpnit 
>< Dpnt 
>< BspAI HinfI > 
>< MaelII >< Bspl43I >< MuntI DrdI >< 
TITGTITTGTT TTGGAATTGT AACGTTGATC GTTACCCAGC CAATGCAATT GTGTGTAGGT TTGACACAAG 
19120 19130 19140 19150 19160 19170 19180 
Zsp2I >< 
>< Sphti 
> < PpuldI 
>< Pael 
>< Nspl 
>< Serel >< NspHI 
>< Mval >< Nlalil 
>< EcoRII Mph1103I >< 
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>< Ecll1l361 
>< DsaVv 
>< Bstorl 
>< BStnr 
>< BsiLI 
><. Plel >< ApyI 
AGTCTTGTCA AACTTGAACT TACCAGGCTG TGATGGTGGT AGTTTGTATG 
19190 19200 19210 19220 19230 
>< Tru9l 
> < Munl 
. >< TthHBst >< Msel 
>< BegI/a >< Taql >< Dral 
>< Alufl >< Begl 
ACTCCAGCTT TCGATAAAAG TGCATTTACT AATTTAAAGC AATTGCCTTT 
19260 19270 19280 19290 19300 
>< Plel 
>< NlaIlil 
>< BsmAT 


>< HinfIl>< Alw26I 
CITTGTGAGTC TCATGGCAAA CAAGTAGTGT 
19330 19340 19350 


TACACGATGC AATTTAGGTG GTGCTGTTTG 


19400 19410 19420 
>< FokrI 
TATAATATGA TGATTTCTGC TGGATTTAGC 
19470 19480 19490 
>< ScrEI 
>< Mval 
>< MaeLII 
>< EcoRII 
>< Ecll361I 
>< Dsav 
>< BstOL 
>< BstNtI 
>< BsiLt 
>< Apyl 
ATACATTTAC CAGGTTACAG AGTTTAGAAA 
19540 19550 19560 
>< SgrAL 
>< Nael 
>< MspI > 
>< HpalIl > 
>< Hapit > 
>< CErlol > 
>< BspWI > 
ACACGCCGGC GAAGCACCTG TTTCCATCAT 
19610 19620 19630 


CGGATATTGA TTATGTTCCA 
19360 19370 


> 
>< 

>< Nlalit> 

CAGACACCAT GCAAATGAGT 
19430 19440 


CTATGGATTT ACAAACAATT 


19500 19510 
>< 
>< 

ATGTGGCTTA TAATGTTGTT 
19570 19580 

< VsprI 

< Tru9t 

< Msel 

< AsnI 

< Asel 

TAATAATGCT GTTTACACAA 
- 19640 19650 
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>< Gsul 
EcoT221 >< 
>< Bsml 
>< BscCI 
>< BpmI >< Nsil 
>< AvaliIi 
TGAATAAGCA TGCATTCCAC 
19240 19250 


CTTTTACTAT TCTGATAGTC 
19310 19320 


SfaNI >< 
>< Maell 
BsaAI >< 
AflIII >< 
CTCAAATCTG CTACGTGTAT 
19380 19390 


Zsp2I > 
>< Seal 
Ppul0E >< 
>< RsaINsil > 
Mph11031 > 
>< SfaNIEcoT22I > 
< Rsal >< Csp6i 
Cspé6éI AvalllI >< 
< AfaI >< Afal 
ACCGACAGTA CTTGGATGCA 
19450 19460 


TGATACTTAT AACCTGTGGA 


19520 19530 
Trudl 
Msel 
AATAAAGGAC ACTTTGATGG 
19590 19600 


AGGTAGATGG TATTGATGTG 
19660 19670 
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>< XhoII 
>< Sau3AI 
>< NdeII 
>< Mf1TI 
>< Mbol 
>< Dpnil 
>< Dpnt >< MaelIl 
>< BstYt ‘ : >< EspI 
>< BspAI >< DdeITru9I >< 
>< Bsp143I >< Tru9t >< CelliMseI >< 
>< BglII >< Msel >< AluI >< Bpulld2I 
GAGATCTTTG AAAATAAGAC AACACTTCCT GTTAATGTTG CATTTGAGCT TTGGGCTAAG CGTAACATTA 
19680 19690 19700 19710 19720 19730 19740 
>< Enud4 hi 
>< Tru9I >< EcoRV 
>< BsrI >< Msel >< BbvlL >< Eco32I 
BRACCAGTGCC AGAGATTAAG ATACTCAATA ATTTGGGTGT TGATATCGCT GCTAATACTG TAATCTGGGA 
19750 19760 19770 19780 19790 19800 19810 
>< NsptI 
>< NspHI 
>< NlalIIlI 
>< BsgI 
>< AELIILT 
CTACAAAAGA GAAGCCCCAG CACATGTATC TACAATAGGT GTCTGCACAA TGACTGACAT TGCCAAGAAA 
19820 19830 19840 19850 19860 19870 19880 
>< Ddel>< MbolI >< Accl 
CCTACTGAGA GTGCTTGTTC TTCACTTACT GTCTTGTTTG ATGGTAGAGT GGAAGGACAG GTAGACCTTT 
19890 19900 19910 19920 19930 19940 19950 
SinI >< 
Sau96I >< 
NspIV >< 
NspHII >< 
NlLaIV >< 
Eco47I >< 
Cfri3I >< 
>< BslI 
BsiZI >< 
>< BsiYft 
BseBI >< 
Bmel8I >< 
>< Trust AvallI >< 
>< Msel Asul >< 
TTAGAAACGC CCGTAATGGT GTTTTAATAA CAGAAGGTTC AGTCAAAGGT CTAACACCTT CAAAGGGACC 
19960 19970 19980 19990 20000 20010 20020 
>< VspI 
>< Tru9l 
>< Plel 
>< Rmal >< Msel Tru9l >< 
>< Nhel >< MaeIIl >< Tru9l 
>< Mael >< AsnI >< T£IT MseI >< 
>< HgaI>< Alul >< HinfI>< Asel >< HinfI >< Msel 
AGCACAAGCT AGCGTCAATG GAGTCACATT AATTGGAGAA TCAGTAAAAA CACAGTTTAA CTACTTTAAG 
20030 20040 20050 20060 20070 20080 20090 


>< Ddef >< MniI Tru9I >< 
>< BsmATI >< Ddel 
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>< AccI >< Alw26I >< BfriMseI >< 
AAAGTAGACG GCATTATTCA ACAGTTGCCT GAAACCTACT TTACTCAGAG CAGAGACTTA GAGGATTTTA 
20100 20110 20120 20130 20140 20150 20160 
>< TthHBsi 
>< Taqi 
>< SstI 
>< Sdul XhoI >< 
>< SacI TthHB8I > 
> < PaeR7TI TaqI > 
> < NspIII SlaI >< 
>< NspIt PaeRTI >< 
>< HgiAL NspIII >< 
> < Eco88sI >< Mnlt 
>< XemI > < XhoI>< Eco24I Eco88I >< 
>< Sau3Al >< Ecll36II CerI >< 
>< NdelIl > < SlaI>< Bsp1286I BspwWI >< 
>< Mbol > < CerI>< BmylI Bool >< 
>< DpniIi > < BeoI>< Banil > < BegIi/a 
>< Dpni > < Ama87I AvalI >< 
>< BspAI > < AvaI>< Aiw21I Ama87I >< 
>< Bspl43I >< Alul >< EcoRI >< FokIAlulI >< 
AGCCCAGATC ACAAATGGAA ACTGACTTTC TCGAGCTCGC TATGGATGAA TTCATACAGC GATATAAGCT 
20170 20180 20190 20200 20210 20220 20230 
>< TChHBsl 
>< TaqI 
>< Sful 
>< Nspv 
>< Lspt 
>< Csp45I 
>< BstBI 
>< Bsp1l19TI 
>< Bsicl >< MboITI 
>< Bpul4ft >< BbsI Tru9gI >< 
>< AsulI >< BcegI >< NilaIII >< AciIMseI >< 
CGAGGGCTAT GCCTTCGAAC ACATCGTTTA TGGAGATTTC AGTCATGGAC AACTTGGCGG TCTTCATTTA 
20240 20250 20260 20270 20280 20290 20300 
>< Hphi 
>< HinPli 
>< HinéI 
>< Espr > < HhalI >< TFil 
>< Ddel >< Haell 
>< Celll >< Eco47IIl >< Tru9l 
>< BpullO2I > < Cfol >< HinfI >< Msel 
>< Bfri >< Bsp143II >< MnlI 
ATGATAGGCT TAGCCAAGCG CTCACAAGAT TCACCACTTA AATTAGAGGA TTTTATCCCT ATGGACAGCA 
20310 20320 20330 20340 20350 20360 20370 
>< MstI 
>< HinPLI Sau3ATI >< 
>< HinéI NdeII >< 
>< Hhal MboI >< 
>< Espr DpnII >< 
>< Fdill DpnI >< 
>< Cfol BspAI >< 
>< SfaNI >< Avill Bspl43I >< 
CAGTGAAAAA TTACTTCATA ACAGATGCGC AAACAGGTTC ATCAAAATGT GTGTGTTCTG TGATTGATCT 
20380 20390 20400 20410 20420 20430 20440 
>< TthHBst 
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>< TeHLLIlL 
>< Taqi 
>< AspI > < MaelII MaeLlII >< 
TTTACTTGAT GACTTTGTCG AGATAATAAA GTCACAAGAT TTGTCAGTGA TTTCAAAAGT GGTCAAGGTT 
20450 20460 20470 20480 20490 20500 20510 
>< Nspi 
>< NSpHI 
‘>< NlalII 
>< FokI 
>< Muni > < Nlalifi >< AfLIII. 
ACAATTGACT ATGCTGAAAT TTCATTCATG CTTTGGTGTA AGGATGGACA TGTTGAAACC TTCTACCCAA 
20520 20530 20540 20550 20560 20570 20580 
>< SfaNI 
>< SerFI 
>< Mval 
>< EcoRIL 
>< Ecl1361I 
>< DsaV 
>< BstOL >< SfaNnI 
>< BstNI >< RsaI BspWI >< 
>< BsiLt > < Csp6I BsmI > 
>< Bspwi >< Apyl >< Afal BscCI >< 
AACTACAAGC AAGTCAAGCG TGGCAACCAG GTGTTGCGAT GCCTAACTTG TACAAGATGC AAAGAATGCT 
20590 20600 20610 20620 20630 20640 20650 
>< EcoS7I >< MaelII >< HphtI 
TCTTGAABAG TGTGACCTTC AGAATTATGG TGAAAATGCT GTTATACCAA AAGGAATAAT GATGAATGTC 
20660 20670 20680 20690 20700 20710° 20720 
> < Rsal 
>< Cspert 
>< Bst11071I >< Trugl >< Alul 
>< Acct >< Msel > < AfaINlaIII >< 
GCAAAGTATA CTCAACTGTG TCAATACTTA AATACACTTA CTTTAGCTGT ACCCTACAAC ATGAGAGTTA 
20730 20740 20750 20760 20770 20780 20790 
>< Scr&L 
>< Rsal 
>< Mval 
>< EcoRII >< NspBITI 
>< Ecll361 >< Sdul 
> < Cspél >< NspIit 
>< BstOL >< PvullI>< HgiAI 
>< BstNI >< Ddel 
>< BsiLI >< Psp5I>< Bspl2861 
>< ApyI >< Alul >< BmyTf 
>< DsaVo< Afal >< Alw21I 
TTCACTTTGG TGCTGGCTCT GATAAAGGAG TTGCACCAGG TACAGCTGTG CTCAGACAAT GGTTGCCAAC 
20800 20810 20820 20830 20840 20850 20860 
>< Xholl 
>< TruSl 
>< Sau3Al 
>< NdeII 
>< TthHB8I >< Msel 
>< MELT 
>< Mbol 
>< MamI 
>< Dpnit 


>< T£LI >< Dpni 
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>< BstYI > < TLL 
>< BspAI > < HinfTt 
>< HinfI>< Bsp143I >< Esp3I >< Trugl 
>< BsiBI >< Tthi1lit >< BsmBI >< Msel 
>< BsaBI >< BsmAI > < BsmAI 
>< BsrI >< TaqI >< BglII >< AspI >< Alw26I >< HgaI> < Alw26I 
TGGCACACTA CTTGTCGATT CAGATCTTAA TGACTTCGTC TCCGACGCAG ATTCTACTTT AATTGGAGAC 
20870 20880 20890 20900 20910 20920 20930 
>< StyI 
>< SinI 
>< Sau96I 
> < Sint >< Rmal 
> < Saug6l >< Nspiv 
>< PssI NspHII >< 
>< PspSII >< Mael 
> < PpuMLl >< EcoTl4l 
> < Nsplv >< Ecod7I 
>< NspHII >< Ecol30I 
>< NlalVv >< Cfr13I 
> < Ecod0109I >< BssT1Ii 
> < Bcod47L >< Bsi2ti 
> < DralIl >< BsaJTr 
> < Cfr13I >< Bmel8I 
> < Bsi2Zl >< BinI 
>< BscBI >< Avril 
>< Rsal > < Bmel®8l >< Avall 
> < Csp6l > < Avall >< Asul 
>< Afal > < Asul AfLIII >< 
TGTGCAACAG TACATACGGC TAATAAATGG GACCTTATTA TTAGCGATAT GTATGACCCT AGGACCAAAC 
20940 20950 20960 20970 20980 20990 21000 
>< NspI 
>< NspHI 
>< NlaIII >< Plel RmaI >< 
>< MaellIt >< HinfI MaeI >< 
ATGTGACAAA AGAGAATGAC TCTAAAGAAG GGTTTTTCAC TTATCTGTGT GGATTTATAA AGCAAAAACT 
21010 21020 21030 21040 21050 21060 21070 
>< ScrFI 
>< Mval 
>< EcorRIil 
>< Ecll 361 
>< DsaV 
>< BstOr Sau96I > 
>< BstNI NspIV > 
>< BsiLI Cfrl3I > 
>< BsaJl BsiZI > 
>< BsaJI >< SfcI >< BsmI >< Bsmi AsulI > 
>< Apyl > < Alul >< BscCI >< BscCIHindIII ><>< Alul 
AGCCCTGGGT GGTTCTATAG CTGTAAAGAT AACAGAGCAT TCTTGGAATG CTGACCTTTA CAAGCTTATG 
21080 21090 21100 21110 21120 21130 21140 
>< Zsp2t 
>< Ppuldl 
>< Pall >< Nsil 
>< HaelllI >< Mph11031 Tru9I >< 
>< BsuRI >< MaellIlI >< EcoTt22I >< Msel 
>< BshI >< NlalII>< Alul >< Begl >< AvalII >< SfaNIBcgI/a >< 


GGCCATTTCT CATGGTGGAC AGCTTTTGTT ACAAATGTAA ATGCATCATC ATCGGAAGCA TTTTTAATTG 
21150 21160 21170 21180 21190 21200 21210 


FIGURE 13.49 


265 


GGGCTAACTA TCTTGGCAAG CCGAAGGAAC 
21220 21230 21240 


>< MboIlI 

>< Gsul 

>< BsrI 

>< Bpmt 

>< BbsI 
GAGGAACACA AATCCTATCC AGTTGTCTTC 
21290 21300 21310 


>< Tru9I 
>< Msel 

>< Esp4I> 
>< BsmAI 


>< Alw26L 


>< AfLII> 
AGAGGAACTG CTGTAATGTC TCTTAAGGAG 
21360 21370 21380 


GTAGGCTTAT CATTAGAGAA AACAACAGAG 


21430 21440 21450 
>< Nspi 
>< NspHI 
>< NlaIII 
CATGTTTATT TTCTTATTAT TTCTTACTCT 
21500 21510 21520 
> < Alul 
GATGTTCAAG CTCCTAATTA CACTCAACAT 
21570 21580 21590 
>< Sau3AlI 
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>< Zsp2t 
>< SphI 


>< PpuldI 


> 
AAATTGATGG CTATACCATG 
21250 21260 


>< 
TTTGACATGA 
21330 


CTATTCACTC 
21320 


< Tfil 


>< 

< HinfI 

AATCAAATCA ATGATATGAT 
21390 21400 


AAGTGATATT 
21470 


TTGTGGTTTC 
21460 


>< Spel 
>< Rmal 
>< MaeI >< MaelliI 
CACTAGTGGT AGTGACCTTG 
21530 21540 


>< Mnlt 
ACTTCATCTA TGAGGGGGGT 
21600 21610 
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>< Pael 
>< NspI 
>< NspHI 
>< Nsil 
>< NlaIIlI 
< NlalIl 
>< Mphi1l03I 
>< EcoT22I 
<. AvalII >< Mn1lt 
CATGCTAACT ACATTTTCTG 
21270 21280 


Tru9I >< 

>< Tru9t 

MseTt >< 

>< MseTlt 

MniI >< 

NlalIil >< Mnlt 
GCAAATTTCC TCTTAAATTA 
21340 21350 


Ksp632I >< 
MboII >< Earl 
Eam11041I >< 
TTATTCTCTT CTGGAAAAAG 
21410 21420 


>< Trugl 
>< Msel 
>< HindIII 
>< HincIIl 
>< HpaI AflIIt > 
CTTGTTAACA ACTAAACGAA 
21480 21490 


>< Vnel 
>< Snot 
>< Sdul 
>< NspIt 
>< Hpall 
>< HgiAL 
>< Hapit 
>< Cfrl10I 
>< Bsp1286I 
>< MspI>< BmyI 
>< ApaLI 
>< Alw44I 
>< AgeI >< Alw21I 
ACCGGTGCAC CACTTTTGAT 
21550 21560 


TTACTATCCT GATGAAATTT 
21620 21630 
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>< NdeII 
>< Mbol 
>< Dpnit 
>< Dpni >< Tru39I 
>< BspAI >< MseI > < MbolIlI 
>< Bsp143I >< DdeI >< MaelIt 
TTAGATCAGA CACTCTTTAT TTAACTCAGG ATTTATTTCT TCCATTTTAT TCTAATGTTA CAGGGTTTCA 
21640 ‘ 21650 21660 21670 21680 21690 21700 
>< VspiI 
>< Tru9l 
>< MseI ~ 
>< AsnI >< Trudl >< FokI 
>< AseI >< Maell >< MseI >< BbhvI > < Fnu4di 
TACTATTAAT CATACGTTTG GCAACCCTGT CATACCTTTT AAGGATGGTA TTITATTTTGC TGCCACAGAG 
21710 21720 21730 21740 21750 21760 21770 
>< BslI 
>< DsaI>< BsiYI >< NlalII 
>< BsaJI > < MaelIl 
AAATCARATG TTGTCCGTGG TTGGGTTTTT GGTTCTACCA TGAACAACAA GTCACAGTCG GTGATTATTA 
21780 21790 21800 21810 21820 21830 21840 
>< Nspt 
>< Trudl >< NspHI 
>< Msel >< NlafIi 
>< HphtiI >< MaelIl >< MaelIl 
TTAACAATTC TACTAATGTT GTTATACGAG CATGTAACTT TGAATTGTGT GACAACCCTT TCTTTGCTGT 
21850 21860 21870 21880 21890 21900 21910 
>< StyI >< Zsp2t 
>< NlaIIl >< Trugt 
>< NcoI >< RsaI >< Ppuldl TthHB8I >< 
>< EcoTl4I >< Nsil >< TaqI 
>< Ecol30I >< Msel SfaNI >< 
>< DsaI>< Csp6I >< Mph1ll03I RsaI >< 
>< BssT1I >< TthHB8I >< EcoT22T Csp6I >< 
>< BsaJI>< Afal >< Taqil >< Avalli AfaI >< 
TTCTAAACCC ATGGGTACAC AGACACATAC TATGATATTC GATAATGCAT TTAATTGCAC TTTCGAGTAC 
21920 21930 21940 21950 21960 21970 21980 
>< Trugt 
>< Msel 
>< Dral 
ATATCTGATG CCTTTTCGCT TGATGTTTCA GAAAAGTCAG GTAATTTTAA ACACTTACGA GAGTTTGTGT 
21990 22000 22010 © 22020 22030 22040 22050 
>< Sau3Al 
>< NdeII 
>< Mbol 
>< Dpnit 
>< TrudI >< Dpnti 
>< Msel >< BspAI 
>< DraI >< SfcI Bsp1431I >< 
TTARAAATAA AGATGGGTTT CTCTATGTTT ATAAGGGCTA TCAACCTATA GATGTAGTTC GTGATCTACC 
22060 22070 22080 22090 22100 22110 22120 
>< Trudl 
>< Trudt > < Trud9l >< MselI 
>< Msel > < Msel >< MnlI 
TTCTGGTTTT AACACTTTGA AACCTATTTT TAAGTTGCCT CTTGGTATTA ACATTACAAA TITTAGAGCC 
22130 22140 22150 22160 22170 22180 22190 
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> < Sdul>< SfcI 


>< Pvull 
>< PspSI 
> < NspIit 
>< NspBIIL 
> < MaeII > < Fnud4HI 
> < Bspl286I >< PstI Tru9I > 
>< BspMI > < Bmyl>< Fnu4HI MseI > 
>< Hpht >< BbvI >< Alul >< BbvI 
ATTCTTACAG CCTTTTCACC TGCTCAAGAC ATTTGGGGCA CGTCAGCTGC AGCCTATTTT GLITGGCTATT 
22200 22210 22220 22230 22240 22250 22260 
>< SfaNI 
>< Rsal 
> < Csp6ér 
>< Dral >< Afal >< AlwNI 
TAAAGCCAAC TACATTTATG CTCAAGTATG ATGAAAATGG TACAATCACA GATGCTGTTG ATTGTTCTCA 
22270 22280 22290 22300 22310 22320 22330 
> < Tru9l 
> < Msel 
>< Alul 
AAATCCACTT GCTGAACTCA AATGCTCTGT TAAGAGCTTT GAGATTGACA AAGGAATTTA CCAGACCTCT 
22340 22350 22360 22370 22380 22390 22400 
>< Saul 
>< MstIL 
>< Eco8ilI 
>< Ddel 
>< Cvni 
>< Bsu361 
>< Bse2lli 
>< Axyl >< TET 
>< MniI >< Aoctl >< MnlI >< HinfI >< SspI >< Mnilt 
ABATTTCAGGG TTGTTCCCTC AGGAGATGTT GTGAGATTCC CTAATATTAC AAACTTGTGT CCTTTTGGAG 
22410 22420 22430 22440 22450 22460 22470 
>< Z2sp2I 
>< PpuldI 
>< Nsil 
> < NlaIIt 
>< Mph11031 
>< TrudI : >< EcoT22I 
>< Msel >< AvaliIi 
AGGTTTTTAA TGCTACTAAA TTCCCTTCTG TCTATGCATG GGAGAGAAAA AAAATTICTA ATTGTGTTGC 
22480 22490 22500 22510 22520 22530 22540 
>< Sdul 
>< NspIt 
>< HgiAI 
>< Bspi286éI 
>< BmyI >< Tru9l 
>< Alw21I >< Msel DdeI >< 
TGATTACTCT GTGCTCTACA ACTCAACATT TTITTTCAACC TTTAAGTGCT ATGGCGTTTC TGCCACTAAG 
22550 22560 22570 22580 22590 22600 22610 
>< Sau3Al 
>< NdeIl 
>< Mbol 
>< DpniIt 
>< Dpnti 
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>< BspAI >< Tfil 
>< Bsp143I >< HinfI 
TTGAATGATC TITGCTTCTC CAATGTCTAT GCAGATTCTT TTGTAGTCAA GGGAGATGAT GTAAGACAAA 
22620 22630 22640 22650 22660 22670 22680 
>< SerFI 
>< Mval 
>< HinP1I 
>< Hin6éI 
>< Hhal 
>< HaeIL 
>< EcoRII 
>< Ecll361 
>< DsaV 
>< Cfolt 
>< BstOLI 
>< BstNI 
>< Bspl43II 
>< BsiLI 
>< Apyl > < BsrI >< NlalII 
TAGCGCCAGG ACAAACTGGT GTTATTGCTG ATTATAATTA TAAATTGCCA GATGATTTCA TGGGTTGTGT 
22690 22700 22710 22720 22730 22740 22750 
>< SfaNT 
>< Rmal DdeI >< 
>< Maer ; >< Bsrl BfrIl >< 
CCTTGCTTGG AATACTAGGA ACATTGATGC TACTTCAACT GGTAATTATA ATTATAAATA TAGGTATCTT 
22760 22770 22780 22790 22800 22810 22820 
>< Sau96t 
>< Pall 
>< Nspiv 
> < HindIII 
>< Haelil 
>< EcoO0109I 
>< DraII 
>< Ddel 
>< Cf£r13I 
>< BsuRI 
>< BsizlI 
>< BshI 


>< BfrI >< PssI 
>< NlaIII >< AsuI>< BsmAI 


>< Alul >< Alw26I BspWI >< 
AGACATGGCA AGCTTAGGCC CTTTGAGAGA GACATATCTA ATGTGCCTTT CTCCCCTGAT GGCAAACCTT 
22830 22840 22850 22860 22870 22880 22890 
>< Trug9l 
>< Pall 
>< Mscl 
>< HaeLIt 
>< EaeI>< Msel 
>< Tru9l >< BsuRI 
>< Mserl >< BshI 
>< BspMI >< Ball BsrI >< 
GCACCCCACC TGCTCTTAAT TGTTATTGGC CATTAAATGA TTATGGTTTT TACACCACTA CTGGCATTGG 
22900 22910 22920 22930 22940 22950 22960 
Sau96I >< 


>< PalINsp[V >< 
> < Mspr NspHII >< 
>< HaelllI 
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> < HpalI Ecoa47iI >< 
>< Dsal 
> < HapiI Cfri3f. >< 
>< BsuRISin£ >< 
>< GdilI BsiZI >< 
>< Scal >< BsaJlI 
>< Rsal >< Trugl >< Eael BmelBI >< 
>< Cspél >< MseI >< Cf£rl0I Avall >< 
>< Afal >< Dral >< BshI Asul >< 
CTACCAACCT TACAGAGTTG TAGTACTTTC TTTTGAACTT TTAAATGCAC CGGCCACGGT TTGTGGACCA 
22970 22980 22990 23000 23010 23020 23030 
>< Tru9Ll >< Rsal 
>< Tru9l >< Csp6r 
>< PleI BsrI >< 
> < Trudi >< Msel >< Bsrl 
> < Msel>< Bsri >< Msel >< HinfI >< Afal 
AAATTATCCA CTGACCTTAT TAAGAACCAG TGTGTCAATT TTAATTTTAA TGGACTCACT GGTACTGGTG 
23040 23050 23060 23070 23080 23090 23100 
>< Trudl >< Pall 
>< Msel >< Haelll 
>< MboII >< Gdill 
>< Hpal >< Eael 
>< HindIII >< BsuRI T£iI >< 
>< Hincil >< BshI HinfI >< 
TGTTAACTCC TTCTTCAAAG AGATTTCAAC CATTTICAACA ATTTGGCCGT GATGTTTCTG ATTTCACTGA 
23110 23120 23130 23140 23150 23160 23170 
> < XhoII 
>< TthHBBI 
>< Tagl 
> < Sau3AI 
> < Ndell 
> < MF1LT 
> < Mbol 
> < Dpnil 
>< Dpni 
> < BstYI 
> < BspAI > < SspI 
>< AlwI >< Bsp143I >< HphrI 


TTCCGTTCGA GATCCTAAABA CATCTGAAAT ATTAGACATT TCACCTTGCT CTTTTGGGGG TGTAAGTGTA 


23180 23190 23200 23210 23220 23230 23240 
>< ScrFI 
>< Mval 
>< EcoRIT 
>< Ecll361 >< Trugl 
>< DsaVv >< Msel 
>< Bstor >< Hpal 
>< BstNI >< HindII 
>< BsiLI >< Ecod57I 
>< ApyI >< BsgIl >< HincIl 
ATTACACCTG GAACAAATGC TTCATCTGAA GTTGCTGTTC TATATCAAGA TGTTAACTGC ACTGATGTTT 
23250 23260 23270 23280 23290 23300 23310 
>< Sau3AI 
>< NlalIII 
>< NdeIt 
>< Mbol 
>< DpnIt 
>< Dpnti >< HinPli 
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>< BspWI >< Hin6éI 
>< BspAT > < Hhal PleI >< 
>< SfclI >< Bsp1431I >< AluI> < Cfol >< Bsrf 
CTACAGCAAT TCATGCAGAT CAACTCACAC CAGCTTGGCG CATATATTCT ACTGGAAACA ATGTATTCCA 
23320 23330 23340 23350 23360 23370 23380 
>< TthHBsI 
>< Taql 
>< Salf 
>< Rtri 
>< Nspi 
>< EspI >< NspHI 
>< DdeI >< NlalII 
>< Celli >< Hindil 
>< Bpulld2I>< HincII 
>< Hinftl >< Alul >< AccI 
GACTCAAGCA GGCTGTCTTA TAGGAGCTGA GCATGTCGAC ACTTCTTATG AGTGCGACAT TCCTATTGGA 
23390 23400 23410 23420 23430 23440 23450 
> < SnaBI 
>< Scal 
>< Rsal 
>< Rmal 
>< MaelII >< MaeI 
> < EcolO5I 
>< Rmal >< Cspé6éT 
>< Maelllt > < BsaAI 
>< Alul >< Mael >< Afal 
GCTGGCATTT GTGCTAGTTA CCATACAGTT TCTTTATTAC GTAGTACTAG CCAAAAATCT ATTGTGGCTT 
23460 23470 23480 23490 23500 23510. 23520 
>< Munl 
ATACTATGTC TTTAGGTGCT GATAGTTCAA TTGCTTACTC TAATAACACC ATTGCTATAC CTACTAACTT 
23530 23540 23550 23560 23570 23580 23590 
RsaI >< 
>< MnlI 
Csp6I >< 
>< SfcI AfaI >< 
TTCAATTAGC ATTACTACAG AAGTAATGCC TGTTTCTATG GCTAAAACCT CCGTAGATTG TAATATGTAC 
23600 23610 23620 23630 23640 23650 23660 
> < Tfil 
> < HinflL 
>< Acil > < Alul 
ATCTGCGGAG ATTCTACTGA ATGTGCTAAT TYGCTTCTCC AATATGGTAG CTTTTGCACA CAACTAAATC 
23670 23680 23690 23700 23710 23720 23730 
>< Vnel 
>< Sdul 
>< NspIit 
>< HgiAI >< PmLI 
>< SnolI>< Ddel >< Sau3AI >< PmaCL 
>< Bspl2861 >< NdeIl >< MaeIl 
>< Bmyl >< MboI >< Eco72I 
>< BbvI >< Dpni >< BsaAI 
>< ApaLI >< Bspl43I >< BbrPI 
>< Alw441I >< DpnII >< Alwl 
>< Alw21I >< Enu4H{T >< BspAI >< AflIII 
GTGCACTCTC AGGTATTGCT GCTGAACAGG ATCGCAACAC ACGTGAAGTG TTCGCTCAAG TCAAACAAAT 
23740 23750 23760 23770 23780 23790 23800 
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>< Rsal 
>< CspéI >< Tru9lt 
>< Afal >< SspI >< MseI >< SspI 
GTACAAAACC CCAACTTTGA AATATTTTGG TGGTTTTAAT TTTTCACAAA TATTACCTGA CCCTCTAAAG 
23810 23820 23830 23840 23850 23860 23870 
>< Mnil 
>< Mnlt >< Tru9l >< SfaNI >< HphI NlaIII >< 
>< DdeI © >< MnlI >< MseI >< MaeIII BspHI >< 
CCAACTAAGA GGTCTTTTAT TGAGGACTTG CTCTTTAATA AGGTGACACT CGCTGATGCT GGCTTCATGA 
23880 23890 23900 23910 23920 23930 23940 
>< XholII 
>< Sau3Al 
>< Styl >< Rmal 
>< Rmal >< NdelIl 
>< Mael >< M£LI 
>< EcoT1l4t >< Mbol >< MstI 
>< Ecol301 >< Mael >< HinPLI 
>< BssT1I >< VspI >< DpnII >< Hin6i 
>< BsmI >< HphI> < DpnI >< Hhal 
>< BscCI >< Tru9I >< BstYI >< Fspt 
>< BsaJI >< Msel >< BSpAI >< Fdill 
>< BlnI >< Asni > < Bspl43I >< Cfol 
>< AvrII >< Asel >< BglII >< Avill 
AGCAATATGG CGAATGCCTA GGTGATATTA ATGCTAGAGA TCTCATTTGT GCGCAGAAGT TCAATGGACT 
23950 23960 23970 23980 23990 24000 24010 
>< RmaIRsal >< 
>< Mnll >< Fnu4HI >< Fnu4HI Cspé6I >< 
>< BspWI >< BbvI >< BbvI >< BspWI >< MaeIAfaI >< 
TACAGTGTTG CCACCTCTGC TCACTGATGA TATGATTGCT GCCTACACTG CTGCTCTAGT TAGTGGTACT 
24020 24030 24040 24050 24060 24070 24080 
>< MboII 
>< HinP1I 
>< Hinél 
>< Hhat 
>< Haell 
>< Fnu4HI >< Ksp632T 
>< Cfol >< Earl 
>< FokI >< BspWI >< Eam11041 
>< BbvI >< Bspl43II 
GCCACTGCTG GATGGACATT TGGTGCTGGC GCTGCTCTTC AAATACCTTT TGCTATGCAA ATGGCATATA 
24090 24100 24110 24120 24130 24140 24150 
Tru9l >< 
>< Maelll MseI >< 
GGTTCAATGG CATTGGAGTT ACCCAAAATG TTCTCTATGA GAACCAAAAA CAAATCGCCA ACCAATTTAA 
24160 24170 24180 24190 24200 24210 24220 
MaeITI >< 
>< T£il >< Fnu4HI 
>< HinfI >< BovI >< Alul 
CAAGGCGATT AGTCAAATTC AAGAATCACT TACAACAACA TCAACTGCAT TGGGCAAGCT GCAAGACGTT 
24230 24240 24250 24260 24270 24280 24290 
>< Tru9l 
>< Msel 
>< HpaI — >< Ddel 
>< HindIL >< BsmI >< Tru9lI >< Tru9I >< BErl 
>< HinclI>< BscCI >< Msel >< Msel >< Alul 
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GTTAACCAGA ATGCTCAAGC ATTAAACACA CTTGTTAAAC AACTTAGCTC TAATTTTGGT GCAATTTCAA 


24300 24310 24320 24330 24340 24350 24360 
>< Thal 
>< Spotl 
>< Nrult 
>< Mvnt 
>< BstUL >< TthHBstI 
>< Bspé6é8I >< TaqI >< Rsal 
>< EcoRV >< Bsp50I >< MnlI >< Csp6I >< Trudl 
>< Eco32I >< AccII >< MniI >< AcilI>< Afal >< Msel 


GTGTGCTAAA TGATATCCTT TCGCGACTTG ATAAAGTCGA GGCGGAGGTA CAAATTGACA GGTTAATTAC 
24370 24380 24390 24400 24410 24420 24430 


>< MaeIII >< BbvI >< Fnu4HI BbvI >< 
AGGCAGACTT CAAAGCCTTC AAACCTATGT AACACAACAA CTAATCAGGG CTGCTGAAAT CAGGGCTTCT 


24440 24450 24460 24470 24480 24490 24500 
>< Fnu4dHt >< ‘HindIII 
>< BspWI >< Ddel >< HincIilI 
GCTAATCTTG CTGCTACTAA AATGTCTGAG TGTGTTCTTG GACAATCAAA AAGAGTTGAC TTTTGTGGAA 
24510 24520 24530 24540 24550 24560 24570 
> < NspI 
> < NspHI 
> < NlaIII 
>< MaellIfI 
>< NlalII >< MaelIl 
>< MboIlI >< FokI 
>< Fnu4HI >< BbsI BsaAI >< 
>< Acil>< BbovI >< A£1LIII 


AGGGCTACCA CCTTATGTCC TTCCCACAAG 


CAGCCCCGCA TGGTGTTGTC TICCTACATG TCACGTATGT 


24580 24590 24600 24610 24620 24630 24640 
>< SerFI 
>< Mval 
>< EcoRITI 
>< Ecll361 
>< BstOl 
>< BstNI >< HinPll 
>< Mn1lI >< BslI >< HinéL 
>< DsaV>< BsiYl >< Hhal 
>< BsiLI >< Haell 
>< BsaJI>< HphI >< Cfol >< NlaIIlI 
>< Apyl >< Bspl43II >< BspHI EcoNI >< 
GCCATCCCAG GAGAGGAACT TCACCACAGC GCCAGCAATT TGTCATGAAG GCAAAGCATA CTTCCCTCGT 
24650 24660 24670 24680 24690 24700 24710 
>< Mnlt 
>< BslI >< Tru9l 
>< BsiYI >< Msel >< Mnli 
GAAGGTGTTT TTIGTGTTTAA TGGCACTTCT TGGTTTATTA CACAGAGGAA CTTCTTTTCT CCACAAATAA 
24720 24730 24740 24750 24760 24770 24780 
>< Ddel >< Tru9I 
>< BsmAT >< SfaNnt 
>< Sfcl >< Alw26I >< MseIAlwI >< 
TTACTACAGA CAATACATTT GTCTCAGGAA ATTGTGATGT CGTTATTGGC ATCATTAACA ACACAGTTTA 
24790 24800 24810 24820 24830 24840 24850 
>< Sau3AT 
>< NdeIl 
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>< Mbol >< PleI > < Scal 
>< Dpnit >< MnlI > < Ksp6321 > < Rsal 
>< DpniI >< DdeI >< HinfI >< MboII 
>< BspAI >< BspwWI > < Eam11041 >< Csp6éI 
>< Bspl43I >< Alul > < Earl > < Alul > < Afal > < HphI 
TGATCCTCTG CAACCTGAGC TTGACTCATT CAAAGAAGAG CTGGACAAGT ACTTCAAAARA TCATACATCA 
24860 24870 24880 24890 24900 24910 24920 
>< Sau3Al 
>< NdefII 
>< Mbol 
>< Mami 
>< Dpnit 
>< Dpni 
>< BspAI 
>< Bsp1l43I 
>< BsiBI >< Tru9lI >< HindII 
>< BsaBI >< Msel >< HincII AcilI >< 
CCAGATGTTG ATCTTGGCGA CATTTCAGGC ATTAACGCTT CTGTCGTCAA CATTCAABAA GAAATTGACC 
24930 24940 24950 24960 24970 24980 24990 
>< Trudi 
> < TELT 
>< MnilI >< Swal 
>< EcoNt >< Msel 
>< BslI > < Hinfl 
>< MnlI>< BsiYI >< Dral 


GCCTCAATGA GGTCGCTAAA AATTTAAATG AATCACTCAT TGACCTTCAA GAATTGGGAA AATATGAGCA 


25000 25010 25020 25030 25040 25050 25060 
>< Styl 
>< PallI 
>< Haelil 
>< EcoTl4I 
>< Ecol301 
>< BsuRI 
>< BssTII NlalITI >< 
>< Tru9I>< BshI MaelII >< 
>< MseI >< BsadI >< BstxI 
ATATATTAAA TGGCCTTGGT ATGTTTGGCT CGGCTTCATT GCTGGACTAA TTGCCATCGT CATGGTTACA 
25070 25080 25030 25100 25110 25120 25130 
> < SphtI 
> < PaeI 
>< Spel > < Nspt 
> < Rmal > < NspHI 
>< NlalIttL > < NlaliIti 
> < Mael >< MnlI>< BbhvI Fnu4HI >< 
ATCTTGCTTT GTTGCATGAC TAGTTIGTTGC AGTTGCCTCA AGGGTGCATG CTCTTGTGGT TCTTGCTGCA 
25140 25150 25160 25170 25180 25190 25200 
>< Fokl 
>< Ddel 
>< MnlI >< PleI>< HinfI >< BsrI 


AGTTTGATGA GGATGACTCT GAGCCAGTTC TCAAGGGTGT CAAATTACAT 
25210 25220 25230 25240 25250 


Sau3Al 
NdelI 
Mbof 
Denil 
> < Dpnti 
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>< BspATI 
> < Bspl43I 
>< BsgI >< AlwI >< BsrI BspWI > 
GATTTGTTTA TGAGATITTT TACTCTTGGA TCAATTACTG CACAGCCAGT AAAAATTGAC AATGCTTCTC 
25280 25290 25300 25310 25320 25330 25340 
>< Scal 
>< Rsal 
>< Csp6ol >< Sfcl 
>< Afal >< NilallIf >< Acil >< MnltI FokI > 
CTGCAAGTAC TGTTCATGCT ACAGCAACGA TACCGCTACA AGCCTCACTC CCTTTCGGAT GGCTTGTTAT 
25350 25360 25370 25380 25390 25400 25410 
> < HinPlI 
> < Hin6l 
>< Hhal RmaI >< 
>< HaelIl >< HinP1lI NheI >< 
>< Eco47IITI >< Hin6é. MaeI >< 
>< Cfol >< Hhal *“ Fnu4HI >< 
>< BspwWI >< Bspl43II >< Cfol AlulI >< 
TGGCGTTGCA TTTCTTGCTG TITTTCAGAG CGCTACCABA ATAATTGCGC TCAATAABAG ATGGCAGCTA 
25420 25430 25440 25450 25460 25470 25480 
>< EcoNt 
>< Bsli 
>< BsiYl >< Maelit 
>< BbvI >< Bsrft >< BbvI > < Fnud4Ht BovI >< 
GCCCTTTATA AGGGCTTCCA GTTCATTTGC AATTTACTGC TGCTATTTGT TACCATCTAT TCACATCTTT 
25490 25500 25510 25520 25530 25540 25550 
Zsp2I >< 
PpulOLr >< 
> < SfcI >< HinPil NsiI >< 
>< PstI >< Hin6éT >< Rsal Mph1103I >< 
> < Fnu4HI >< Hhal >< CspéI EcoT22I >< 
>< BspMI >< Mnlt >< Cfol >< Afal >< Mnli AvalIII >< 
TGCTTGTCGC TGCAGGTATG GAGGCGCAAT TTTTGTACCT CTATGCCTTG ATATATTTTC TACAATGCAT 
25560 25570 25580 25590 25600 25610 25620 
>< Sfanti 
>< Nspt 
>< NspHI 
>< NlaIII >< SfaNnt 
CAACGCATGT AGAATTATTA TGAGATGTTG GCTTTGTTGG AAGTGCAAAT CCAAGAACCC ATTACTTTAT 
25630 25640 25650 25660 25670 25680 25690 
>< Bst1lLO7I 
>< Accl MaelII >< 
GATGCCAACT ACTTTGTTTG CTGGCACACA CATAACTATG ACTACTGTAT ACCATATAAC AGTGTCACAG 
25700 25710 25720 25730 25740 25750 25760 
>< MbolI 
>< Hpht BstXKI >< 
>< MunI >< MaeIIIT >< MaelIt >< EcoS7I >< BbsI MnlI > 
ATACAATTGT CGTTACTGAA GGTGACGGCA TTTCAACACC AAAACTCAAA GAAGACTACC AAATTGGTGG 
25770 25780 25790 25800 25810 25820 25830 
>< Rsal 
> < NlaILl 
>< Hpht 
>< Tru9I >< TthillI>< Csp6t 
>< Ddel >< DdeI >< MseI>< AspI >< Afal 
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TTATTCTGAG GATAGGCACT CAGGTGTTAA AGACTATGTC GTTGTACATG GCTATTTCAC CGAAGTTTAC 


25840 25850 - 25860 25870 25880 25890 25900 
Tru9l >< 
> < HinfI>< PlelI >< BsrI MselI >< 
>< Alul >< Acclr >< Sfel >< AlwNI >< MbolI HindIII > 
TACCAGCTTG AGTCTACACA AATTACTACA GACACTGGTA TTGAAAATGC TACATTCTTC ATCTTTAACA 
25910 25920 25930 25940 25950 25960 25970 
> < TchHB8I 
>< Trudgl > < Tagli >< Ksp6321 
>< Msel > < MboII >< Barl BspWI >< 
>< Alul : >< EcoS7I >< Eaml11041I AlwI >< 
AGCTTGTTAA AGACCCACCG AATGTGCAAA TACACACAAT CGACGGCTCT TCAGGAGTTG CTAATCCAGC 
25980 25990 26000 26010 26020 26030 26040 
>< XholIl 
>< Sau3AlI 
>< NialVv 
>< NdeITt 
>< MfIL 
>< Mbol 
>< Dpnil 
>< Dpni 
>< BstYI 
>< BstI 
>< BspAI 
>< Bspl1431 RsaI >< 
>< BscBI >< Rmal Csp6I >< 
>< BamHI >< AlwI >< Mael AfaI >< 
AATGGATCCA ATTTATGATG AGCCGACGAC GACTACTAGC GTGCCTTTGT AAGCACAAGA AAGTGAGTAC 
26050 26060 26070 26080 26030 26100 26110 
> < Trudt 
>< RsaTl 
> < MselI 
; >< MboIlt 
> < Rsaf >< MaeIl >< RsaI 
>< Cspé6I >< Cspé6I >< Tru9I >< Cspé6I 
> < Afal >< Afal >< Msel >< Afal 
GAACTTATGT ACTCATTCGT TTCGGAAGAA ACAGGTACGT TAATAGTTAA TAGCGTACTT CTTTTTCTTG 
26120 26130 26140 26150 26160 26170 26180 
>< TrhHBst 
>< TaqI 
>< Rmal >< HinP1I > < Rsal 
> < MaeLit >< Hin6I1 Fnu4HI >< 
>< Mael >< Rmal >< Hhal >< CspérI 
>< FoklI >< Mael >< Cfol >< BbhvI > < Afal 
CTTTCGTGGT ATTCTTGCTA GTCACACTAG CCATCCTTAC TGCGCTTCGA TTGTGTGCGT ACTGCTGCAA 
26190 26200 26210 26220 26230 26240 26250 
>< Trudl 
>< Tru9t >< Thal 
>< Msel >< Muni 
>< SspI >< MaellI >< Msel 
>< Hpalt >< Bsturl Ksp632I > 
>< Hindil >< Maell >< BspSOr >< MboII EarI > 
>< HincII >< AcclI >< AccII EamllO4I > 
TATTGTTAAC GTGAGTTTAG TAAAACCAAC GGTTTACGTC TACTCGCGTG TTAAAAATCT GAACTCTTCT 
26260 26270 26280 26290 26300 26310 26320 
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>< Sau3AI 
>< NdeIf 
>< MboI 
>< Dpnift 
>< MboII>< Opnti 
>< KXmnI >< BspATI> < Eco57I >< TruSt 
>< Asp700I>< Bsp143I >< MseLl 
GAAGGAGTTC CTGATCTTCT GGTCTAAACG AACTAACTAT TATTATTATT CTGTTTGGAA CTTTAACATT 
26330 26340 26350 26360 26370 26380 26390 
>< SerFI 
>< Mval 
>< EcorRIt 
>< Ecll136I 
>< DsaV NlalIV >< 
>< Rsal >< BstOlL 
>< Mnlt >< Trud9t >< BstNI RmaI >< 
>< Csp6I >< Msel >< BsiLI MaeI >< 
> < NlaliIt >< Afal > < Alut >< ApyIBscBI >< 
GCTTATCATG GCAGACAACG GTACTATTAC CGTTGAGGAG CTTAAACAAC TCCTGGAACA ATGGAACCTA 
26400 26410 26420 26430 26440 26450 26460 
>< ScrFI 
>< Rmal 
>< Mval 
>< Mael 
>< EcoRITI 
>< Ecll361 
>< DsaV 
>< BstOl 
>< BstNI 
>< BsiLI 


>< ApyI >< MaelII 
GTAATAGGTT TCCTATTCCT AGCCTGGATT ATGTTACTAC AATTTGCCTA TTCTAATCGG AACAGGTTTT 


26470 26480 26490 26500 26510 26520 26530 
>< Pall 
>< Mscl 
>< MnlI >< MaelIII 
>< Haelll 
>< Eael 
>< BsuRI 
>< BsrI 
>< Rsal >< BspWI 
>< Cspé6él >< HindIIil ; >< BshI 
>< Afal >< Alul >< Ball >< BbvI Fnu4HI >< 
TGTACATAAT AAAGCTTGTT TTCCTCTGGC TCTTGTGGCC AGTAACACTT GCTTGTTTTG TGCTTGCTGC 
26540 26550 26560 26570 26580 26590 26600 
>< VspI 
>< TruSTt 
>< Msel >< HphiI 
>< SfcI >< AsnI >< Bsrl 


>< AccI >< AseI>< MaeIII>< Acil 
TGTCTACAGA ATTAATTGGG TGACTGGCGG GATTGCGATT GCAATGGCTT GTATTGTAGG CTTGATGTGG 


26610 26620 26630 26640 26650 26660 26670 
>< EspI 
>< EcodS7I 
>< Ddel 
>< CelllI >< Rsal 
>< Bpulld2t >< Cspél 
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>< BfrI >< Afal 
>< Alul >< Acil MboITI > 
CTTAGCTACT TCGTTGCTTC CTTCAGGCTG TTTGCTCGTA CCCGCTCAAT GTGGTCATTC AACCCAGAAA 
26680 26690 26700 26710 26720 26730 26740 
>< ScrFI 
>< Neil 
>< MspI 
>< HpaIl 
>< HapIt 
>< DsaV>< MnlI 
>< BslI 
>< BsiYI 
>< BsaJI >< MunI > < XemiI 
>< Bent >< MaelII >< Acil >< NlalIti 
CABACATTCT TCTCAATGTG CCTCTCCGGG GGACAATTGT GACCAGACCG CTCATGGAAR GTGAACTTGT 
26750 26760 26770 26780 26790 26800 26810 
Tru9I >< 
SinI > 
Sau96I > 
PpuMI > 
NspIv > 
MseI >< 
>< MaeIII 
>< Sau3At > < RmaI >< Haell 
>< NdeII >< Pall > < Mael EcoO109I > 
>< Mbol >< MspI >< HinPlIEco47I > 
>< Foal >< Hpail >< StyI>< Hin6I DralI > 
>< Dpnil >< HapIl >< EcoTl4I Cfrl3I > 
>< Dpnt >< HaefII >< Ecol30I>< Bspl43II 
>< BspAI >< Gdill >< BssT1LI BsiZI > 
>< Bsp143I >< Eael >< BsaJI Bmel8I > 
>< BsiQI >< BsuRI >< BlnI >< Hhal AvaII > 
>< Bell >< Maelll >< BshlI >< AvrcII >< CfolI AsulI > 
CATTGGTGCT GTGATCATTC GTGGTCACTT GCGAATGGCC GGACACTCCC TAGGGCGCTG TGACATTAAG 
26820 26830 26840 26850 26860 26870 26880 
>< Sau3AI 
>< NdelIlI 
>< Mbol 
>< DpnIt 
>< Dpnti 
>< PssI >< BspMI 
>< Psp5SIiI >< BspAI >< XmnI 
>< NspHIt >< Bsp1l43I >< Asp700I > < Hgal Fnu4dHI >< 
GACCTGCCAA AAGAGATCAC TGTGGCTACA TCACGAACGC TTTCTTATTA CAAATTAGGA GCGTCGCAGC 
26890 26900 26910 26920 26930 26940 26950 
>< T£il 
>< Hinfl 
>< BbovI > < Trudt 
>< BovI >< Fnu4Htl >< Acil > < Msel 
GTGTAGGCAC TGATTCAGGT TTTGCTGCAT ACAACCGCTA CCGTATTGGA AACTATAAAT TAAATACAGA 
26960 26970 26980 26990 27000 27010 27020 
>< MspI >< Rsal 
>< Hpall >< Rmafl 
>< HapIl >< Cspé6l 
>< CfrlOl >< MaeI>< BcgI HindII >< 
>< Begl/a >< SspI >< AfaI >< MaeIII HincII >< 
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GCTAGTACAG TAAGTGACAA CAGATGTTTC ATCTTGTTGA 


27030 27040 27050 27060 27070 27080 27090 
>< ScrFI 
>< Mval 
>< MaeIII 
>< EcoRII 
>< Ecll361 
>< DsaV 
>< BstoOl 
>< BstNI 
>< BsiLlI >< T£II 
>< ApyI >< Mnilt HinfI >< 
CTTCCAGGTT ACAATAGCAG AGATATTGAT TATCATTATG AGGACTTTCA GGATTGCTAT TTGGAATCTT 
27100 27110 27120 27130 27140 27150 27160 
>< BsmAT >< Tru9L > < MnlI 
>< MaeIlI >< Alw26I >< MseI >< Ddel >< MboII 
GACGTTATAA TAAGTTCAAT AGTGAGACAA TTATTTAAGC CTCTAACTAA GAAGAATTAT TCGGAGTTAG 
27170 27180 271390 27200 27210 27220 27230 
>< Ksp632I 
>< MbolII >< Bart 
>< MboII >< NlaIIIEami104I >< 
ATGATGAAGA ACCTATGGAG TTAGATTATC CATAAAACGA ACATGAAAAT TATTCTCTTC CTGACATTGA 
27250 27260 . 27270 27280 27290 27300 
> < RsaI >< Rsal 
>< Csp6I >< CspéL 
> < Alul >< MnLI > < AfaI >< Afal 
TTGTATTTAC ATCTTGCGAG CTATATCACT ATCAGGAGTG TGTTAGAGGT ACGACTGTAC TACTAAAAGA 
27310 27320 27330 27340 27350 27360 27370 
>< Mnlt >< HphI >< Hphi >< Mnilt 
ACCTTGCCCA TCAGGAACAT ACGAGGGCAA TTCACCATTT CACCCTCTTG CTGACAATAA ATTTGCACTA 
27380 27390 27400 27410 27420 27430 27440 
Sau3AI > 
> < Pvull 
> < Pspst 
> < NspBII 
>< TthHBst NdeII > 
>< Taq MboI > 
>< Rsal >< Fnu4HI 
>< Cspé6é. DpnII > 
>< Rmal >< BbvI BspAI > 
>< Mael >< Afal > < Alut 
ACTTGCACTA GCACACACTT TGCTTTTGCT TGTGCTGACG GTACTCGACA TACCTATCAG CTGCGTGCAA 
27450 27460 27470 27480 27490 27500 27510 
>< SstI 
>< Sdul 
>< SacI 
>< NspIt 
>< HgiAI 
>< Eco24I 
> < Ecll36I1I 
>< BSpwWL 
>< Bspl2861 
>< Bmyl 
>< HphI >< BanII 
>< Dpnl >< MnLi >< Alw21iI 
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>< Bsp1431 >< MnIit 
GATCAGTTTC ACCAABAACTT TTCATCAGAC AAGAGGAGGT 
27520 27530 27540 27550 
>< Rmal >< Trugl 
>< Mael >< Msel 
>< Fnu4Hki >< Hphi 
CATTGTTGCT GCTCTAGTAT TTTTAATACT TTGCTTCACC 
27590 27600 27610 27620 
>< Tru9I 
>< Msel 
CTTTAATTGA CTTCTATTTG TGCTITTTAG CCTTTCTGCT 
27660 27670 27680 27690 
>< XhoIT 
>< Xbal 
> < ScrFI 
>< Sau3AI 
>< Rmal 
>< NdelI 
> < Mval 
>< MFLI 
>< Mbol 
>< EcoRII>< Mael 
> < Ecll36I 
>< Dpnilt 
>< DpnI 
>< BstYI 
> < Bstor 
> < BstNnr 
>< TthHBSI >< BspAT > 
>< DsaV>< Bsp1431 
> < BsiLI >< 


>< TaqgiI > < Apyl > < Alwl > 


TTGGTTTTCA CTCGAAATCC AGGATCTAGA AGAACCTTGT 
27730 27740 27750 27760 
>< NdeI 
ATTGTTTIGA CTTGTATTTC TCTATGCAGT TGCATATGCA 
27800 27810 27820 27830 

>< Xholl 

>< Sau3AI 

>< NdeII 

> < Molt 
>< ME1I 


> < Alul BbvI >< 
TCAACAAGAG CTCTACTCGC CACTTTTTCT 
27560 27570 27580 


SstI 

Sdul 

SacI 

NspIiI 

HgiAl 

Eco24I 
Ecl136II >< 

Bsp1286I >< 
BmyI >< 

BaniI >< 

Alw21I >< 

AluI >< 

AGACAGAATG AATGAGCTCA 
27640 27650 


os 
>< 
>< 
os 
>< 
>< 


>< Tru9l 

>< MselI 
ATTAAGAGAA 
27630 


>< Trud9l 

>< Msel 

TTAATAATGC TTATTATATT 
27710 27720 


ATTCCTTGTT 
27700 


< Rsal 

>< MboIlI 

Cspé6éI 

< Afal >< NlaIIl 

ACCAAAGTCT AAACGAACAT GAAACTTCTC 
27770 27780 27790 


>< HinP1I 
>< Hin6I 
>< Hhal 
>< Rsal >< HaelI 
>< SfclI >< Eco47III 
>< Csp6I>< CfoI SfaNI >< 
>< AfaI >< Bspl43II 
CIGTAGTACA GCGCTGTGCA TCTAATAAAC 
27840 27850 27860 
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>< Mbol 
>< Dpnil 
>< DpnI >< Rsal 
>< BstYI >< MbolIl 
>< NlaILI>< Bspat >< Csp6I >< RmalI 


>< AlwI >< Bsp143I >< Afal >< Mael 
CTCATGTGCT TGAAGATCCT TGTAAGGTAC AACACTAGGG GTAATACTTA TAGCACTGCT TGGCTTTGTG 


27870 27880 27890 27900 27910 27920 27930 
>< Sdul 
>< Rmal 
>< NspIt 
>< Mael 
>< HgiAl 
>< Bsp1286I1 >< NspI 
>< BmyL >< NspHI 
>< Alw21I >< NlaliI >< MaelIl 
CTCTAGGAAA GGTTTTACCT TTTCATAGAT GGCACACTAT GGTTCAAACA TGCACACCTA ATGTTACTAT 
27940 27950 27960 27970 27980 27990 28000 
> < Xholl 
> < Sau3AI > < Van91I >< Rsal 
>< Pvull >< Nlalv 
>< Psp5I >< KpnI >< NlaIII 
> < NdeII > < Pf£lMI >< Ecoé4I >< MaelIl 
> < MELI>< NspBIL >< Csp6I>< HphI 
> < Dpnit >< HinPll >< BscBI >< Ecoo651 
>< Bsp143I >< Hin6lt >< BanI >< BspHI 
> < BstYI > < BslI >< HhaI >< Rmal >< Asp718 >< Eco9l1I 
> < BspAI > < BsiYI>< CfoI >< MaelI >< Afal >< BstPI 
> < Mbol>< AlulI>< BspWI >< BspWI >< AccB1ilI >< BstEII 
>< AlwI >< DpnI > < AccB7I >< Alul >< Acc6SI >< BovI 
CAACTGTCAA GATCCAGCTG GTGGTGCGCT TATAGCTAGG TGTTGGTACC TTCATGAAGG TCACCAAACT 
28010 28020 28030 28040 28050 28060 28070 
>< Sinl 
>< Saud6l 
>< NspIv 
NspHITI >< 
NlaIV >< 
>< Eco47I 
>< C£rl31 
>< RsaI >< BsiZt 
>< Fnu4HI >< MaelI BscBI >< 
>< Esp31 >< Csp6I ‘>< Tru9I >< Bmel8sI 
>< BsmAT >< BsmBI >< Msel >< Tru9I >< Avall 
>< Alw261 >< Afal >< DraI >< Msel >< Asul 
GCTGCATTTA GAGACGTACT TGTTGTTTTA AATAAACGAA CAAATTAAAA TGTCTGATAA TGGACCCCAA 
28080 28090 28100 28110 28120 28130 28140 
>< Sint 
>< Sau96l 
>< Nspiv 
>< NspHIT 
>< NlaIV 
>< Ecod7I 
>< Cf£ri31 
>< Sdul >< Bsizt 
>< NspItr >< BscBI 
>< Bsp12861 >< Bmelési 
>< Bmyl . >< AvalI >< TLil 
>< Maell >< Acil >< Asul >< HinfT >< MnlI 
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CCGCATTACA TTTGGTGGAC CCACAGATTC AACTGACAAT AACCAGAATG 
28170 28180 28190 28200 28210 


>< HinP1lI >< StyI 


> 
> 


Nn 


Pall 
HaelI II 


o< 


A 


>< BspWI 


>< 

>< HgaI> < 

GAGGACGCAA TGGGGCAAGG 
28220 28230 


BsuRI 
BshI 


28240 


>< MaLt 
>< AluI >< DdeI > < NlalIt 
CACAGCTCTC ACTCAGCATG GCAAGGAGGA 


>< HaelITt 
Hin6I >< 
>< HhaI>< Ecol301I 
>< BSSTIT 
>< Bsp143iI1 

>< CfolI>< BsaJI 


EcoTl4l 


>< Hgal 


CCAAAACAGC GCCGACCCCA AGGTTTACCC AATAATACTG CGTCTTGGTT 


28250 28260 28270 28280 
>< TthHBsi 
> < ScrFI 
>< Pall 
>< PaeR7I 
>< NspIil 
> < Mval 
>< HaelIII 
>< EcoRII 
>< Eco88I 
>< XhoI > < Ecli36I 
>< DsaV 
>< BsuRL 


>< SlaI > < Bstol 
>< MnLI>< Tagi> < BstwNI 
>< Corl > < BsiLI 
>< Hintt >< BshI 

>< T£iI>< BcoI>< BsaJI 

>< Ddel >< Aval > < ApyTt 
>< Bfrt >< Ama&S7I >< MnIlt 

ACTTAGATTC CCTCGAGGCC AGGGCGTTCC AATCAACACC 


28290 28300 28310 28320 28330 28340 28350 
>< Sinl 
>< Sauds6l 
>< Nspiv 
>< NspHIL 
>< Eco47I 
>< Cfrl3I 
>< BsiZt 
>< Bmeldi > < Ksp632I 
>< Avall > < Eaml104I 
>< Asul > < Earl > < AlulI>< MbolII >< Maellit 
AATAGTGGTC CAGATGACCA AATTGGCTAC TACCGAAGAG CTACCCGACG AGTTCGTGGT GGTGACGGCA 
28360 28370 28380 28390 28400 28410 28420 
>< SstIi 
>< Sdul 
>< Sacl 
>< NspIii 
>< HglAIL 
>< Espl 
>< Eco24I >< SauS6l 
>< Ecll36II >< StyI >< Pall 
>< Ddel >< Rmal >< Nspiv 
>< CellIlL >< Mael >< HaelII 
>< Bspl2861 >< EcoTl4I >< Cfrl3I 
>< Bpull02I >< Eco1l30I >< BsuRI 
>< Bmyl >< BssT1i > < Bsrl 
>< BanII >< Rsal >< BsaJI >< BsiZI 
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>< Alw21I >< Csp6I >< Bint >< BshI>< HindIIl 
>< HphI >< Aluf >< Afal >< Avril >< Asul >< Alut 
AAATGAAAGA GCTCAGCCCC AGATGGTACT TCTATTACCT AGGAACTGGC CCAGAAGCTT CACTTCCCTA 
28430 28440 28450 28460 28470 28480 28490 
>< HinPllI 
>< HinéI 
>< Hhal 
>< HaeIlI 
>< Cfol > < MnilI >< NlalV 
>< Bspl43II >< SfaNI >< Ddel >< BscBI 
CGGCGCTAAC AAAGAAGGCA TCGTATGGGT TGCAACTGAG GGAGCCTTGA ATACACCCAA AGACCACATT 
28500 28510 28520 28530 28540 28550 28560 
>< NlaIv 
>< Ecoé4iI 
>< BscBI 
>< Bant 
>< Acil 
>< AccBil >< BovI >< Fnu4hHI >< Mnil 
GGCACCCGCA ATCCTAATAA CAATGCTGCC ACCGTGCTAC AACTTCCTCA AGGAACAACA TTGCCAAAAG 
28570 28580 28590 28600 28610 28620 28630 
>< Thal 
>< MnilI 
>< MaeII >< Mvni 
>< Mnit BstUI >< 
>< Fnu4HI >< Ksp632I Bsp50I >< 
>< BspWI >< Earl >< BsaAI>< Acil 
>< MnlI >< Mnilt >< AcilI>< MbolII >< Eam11041I AccII >< 
GCTTCTACGC AGAGGGAAGC AGAGGCGGCA GTCAAGCCTC TTCTCGCTCC TCATCACGTA GTCGCGGTAA 
28640 28650 28660 28670 28680 28690 28700 
>< ScrFI 
>< Mvat 
>< EcoRII >< TthHBsT 
>< Ecl1l36I >< Rmal 
>< DsaVo< Fnud4Ht >< Nhel 
>< BstOl >< MnlI 
>< BstNI >< Mael 
>< BsiLl > < BspWI 
>< ApyI >< BbvI >< Taqi >< Acil 
TTCAAGAAAT TCAACTCCTG GCAGCAGTAG GGGAAATTCT CCTGCTCGAA TGGCTAGCGG AGGTGGTGAA 
28710 28720 28730 28740 28750 28760 28770 
> < Thal 
> < Muynt 
>< HphI >< Mn1lI 
> < HinPil 
> < Hin6l 
>< Hhal 
> < BstUr >< Rmal PalI >< 
> < Bsp50I >< Mael HaelII >< 
>< BbvI >< Cfol>< Fnu4HI BsuRI >< 
> < AccII>< BspwI - >< Alul BshI >< 
ACTGCCCTCG CGCTATTGCT GCTAGACAGA TTGAACCAGC TTGAGAGCAA AGTTTCTGGT AAAGGCCAAC 
28780 28790 28800 28810 28820 28830 28840 
Rsal >< 
> < PalI>< MaellII >< Moll 
> < Haelll >< Fnu4dI MaeII >< 
> < BsuRI >< Ddel >< Ddel Csp6I >< 
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> < BshI > < BbvI >< Mn1lI >< BspWI >< SfaNI AfaI >< 
AACAACAAGG CCAAACTGTC ACTAAGAAAT CTGCTGCTGA GGCATCTAAA AAGCCTCGCC AAAAACGTAC 
28850 28860 28870 28880 28890 28900 _ 28910 
>< Tthilli 
>< Sinl 
>< Saug6élI 
>< Nspiv 
>< NspHII 
> < Maell 
>< Eco47L 
>< Cf£rl3I 
>< BsmBI 
>< Rsal >< BsiZ@I >< Styl 
>< MaellIi >< Bmel8I >< EcoTf14I 
>< MaelIl >< Esp3I >< AvallI >< Ecol301 
>< Csp6I >< BsmAI >< Asul >< BssTlI 
>< Afal >< Alw26I> < AspI >< BsaJdl 
TGCCACAAAA CAGTACAACG TCACTCAAGC ATTTGGGAGA CGTGGTCCAG AACAAACCCA AGGAAATTTC 
28920 28930 28940 28950 - 28960 28970 28980 
>< SinI 
>< Sau96I 
>< Nspiv 
>< NspHII 
_>< NlaIv >< Pall 
>< Eco47I ' >< HaelIl 
>< Cfrl3I >< Gdill 
>< Bsial >< Fnu4HI 
>< BscBI >< Eael 
>< Bmel8I >< BsuRI 
>< Avall >< BshI BspWI > 
>< Asul >< Acil >< BspWI 
GGGGACCAAG ACCTAATCAG ACAAGGAACT GATTACAAAC ATTGGCCGCA AATTGCACAA TTTGCTCCAA 
28990 29000 29010 29020 29030 29040 29050 
>< BsmI >< NlaIIflI 
>< BscCI >< MnlI >< MaeIII >< MaelIi >< NlarIit 
GTGCCTCTGC ATTCTTTGGA ATGTCACGCA TTGGCATGGA AGTCACACCT TCGGGAACAT GGCTGACTTA 
239060 29070 29080 29090 29100 29110 29120 
>< Xholl 
>< Sau3al 
>< NdelI 
>< Mf£1I 
>< Mbol 
>< FokI 
>< Trudgl >< Dpnil 
>< NlaIv > < Dpnti 
>< NlalIl >< BstYI >< Tthilli 
>< Msel >< BspAI >< MaelIl 
>< BscBI >< BstXKI>< AlwI> < Bspl43I >< AspI BspWI >< 
TCATGGAGCC ATTAAATTGG ATGACAAAGA TCCACAATTC AAAGACAACG TCATACTGCT GAACAAGCAC 
29130 29140 29150 29160 29170 29180 29190 
EspI >< 
DdeI >< 
CelII >< 
Bpulld2t >< 
>< Hgal AluI >< 
ATTGACGCAT ACAAAACATT CCCACCAACA GAGCCTAAAA AGGACAAAAA GAAAAAGACT GATGAAGCTC 
29200 29210 29220 29230 29240 29250 29260 
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>< Plelt 
>< Fnu4HI >< MboII 
>< BspWI >< MboII >< Ksp632T >< Gsul 
>< BsmAL >< MaeIII >< EarlI>< Fnu4HI 
>< Alw26T >< HinfI >< Eam1104I>< BpmI 
>< Acil >< Fnud4HI >< BbvI >< Acil >< Nlalilt 
AGCCTTTGCC GCAGAGACAA AAGAAGCAGC CCACTGTGAC TCTTCTTCCT GCGGCTGACA TGGATGATTT 
29270 29280 29290 29300 29310 29320 29330 
>< NlalIil >< Hinfl NlaIII >< 
>< FokI >< Alul >< T£II>< Ddel >< BspHI 
CICCAGACAA CTTCAAAATT CCATGAGTGG AGCTTCTGCT GATTCAACTC AGGCATAAAC ACTCATGATG 
29340 29350 29360 - 29370 29380 29390 29400 
>< Maell >< AccI 
ACCACACAAG GCAGATGGGC TATGTAAACG TTTTCGCAAT TCCGTTTACG ATACATAGTC TACTCTTGTG 
29410 29420 29430 29440 29450 29460 29470 
>< Trudi 
>< Tru9I 
>< Msel 
>< Msel 
>< XmnI >< Hpal 
>< EcoRI>< MaeIIt >< HindIII Tru9I >< 
>< Asp700L >< BsgI >< HincII MseI >< 
CAGAATGAAT TCTCGTAACT AAACAGCACA AGTAGGTTTA GTTAACTTTA ATCTCACATA GCAATCTTTA 
29480 29490 29500 29510 29520 29530 29540 
XorII > 
TthHB8I > 
TaqI >. 
Sau3AI >< 
RsaI >< 
>< ThaIPvul > 
NdeII >< 
>< MnIilt 
>< MvnIMcrI > 
MboI >< 
DpniIft >< 
Dpni >< 
Csp6I >< 
>< BstUr 
>< HaeIII BspcCI > 
BspAI >< 
>< TthHB8I >< Bsp50I 
>< Pall Bspl43I >< 
>< BsuRI BsiEI > 
>< BshIAfalI >< 
>< MnlI >< TaqI >< Acil 
>< MaelIlt >< Malt >< AccIilI 
ATCAATGTGT AACATTAGGG AGGACTTGAA AGAGCCACCA CATTTTCATC GAGGCCACGC GGAGTACGAT 
29550 29560 29570 29580 29590 29600 29610 
>< Sdul 
>< NspIit 
>< MboII >< VspI 
>< Ksp632I >< Eco24I >< Tru9l 
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GGTGCTGGCGCTGCTCTTCAAATACCTTTTGCTATGCAAATGGCATATAGGTTCAATGGC 
euanmnon “vatrucr Homes “gu cM nou Honncun mining AUST AUIT GS: "cc" the Tee ee meres o 


ATTGGAGTTACCCAAAATGTTCTCTATGAGAACCAAAAACAAATCGCCAACCAATTTAAC 
WICH CHU CMTE GACH GHC NOCHE TEGAN UNCC 


AAGGCGAT TAGTCAAATTCAAGAATCACTTACAACAACATCAACTGCATTGGGCAAGCTG 
urrese re Vcr "oe co Gn teu “gr "GAGC" now foe wire "CBAGC" "cr "CC" TO Te OTe Ce ED Se GE ee 


CAAGACGT TGTTAACCAGAATGCTCAAGCATTAAACACACTTGTTAAACAACTTAGCTCT 
HAG Herag tn gernnonion HOMO H "ge "cco"g" INO CEN G TAG ANG egg rn ee 


AATTTTGGTGCAATTTCAAGTGTGCTAAATGATATCCTTTCGCGACTTGATAAAGTCGAG 
taACHNCH HCHO WCAGCTC Hit HGUECt actA GAGCANGUHGtIC!" Tome aa 


GCGGAGGTACAAATTGACAGGCTAATTACAGGCAGACTTCAAAGCCTTCAAACCTATGTA 
rarCungaitngirinigne HOt CHNNICHiCn TOMHMACHCHUGINETCHrH Ugtagtinnmaging 


ACACAACAACTAATCAGGGCTGCTGAAATCAGGGCTTCTGCTAATCTTGCTGCTACTAAA 
HNCMUCM AGUNG ANATHE OUI Cag ucHrmNcCAgciNnciianigha WOT OHIG 


ATGTCTGAGTGTGTTCTTGGACAATCAAAAAGAGTTGACTTTTGTGGAAAGGGCTACCAC 
PETE GION TET IE CHIE Ce CS OE GS Gt RES BE rh TESTE TE EET SC CN EU atte eae FE TF 


CTTATGTCCTTCCCACAAGCAGCCCCGCATGGTGTTGTCTTCCTACATGTCACGTATGTG 
HUGH AGT HEN CHG HA CHAN HOTU CHNCH AGH AGHA ENGungmdAgingT noun 


CCATCCCAGGAGAGGAACTTCACCACAGCGCCAGCAATTTGTCATGAAGGCAAAGCATAC 
COTE GOTO Te CCE TO TERE OE TE BEET TT OT ET EF BY COT ST COST EE TE TEST COTE IT COTY STC EE EE CAT OTS OU BEAT AE IT STE NEE a8 


TTCCCTCGTGAAGGTGTTTTTGTGTTTAATGGCACTTCTTGGTTTATTACACAGAGGAAC 
PEE TTC ET CTU EAE TE ENE COUNTS ETE CREE EA CTE EEL CECT EAE 8 CHE PTE SHAE NCHA STE CELE 


TTCTTTTCTCCACAAATAATTACTACAGACAATACATTTGTCTCAGGAAATTGTGATGTC 
ceeerese "CAGC" fC wor "En "ou "en erat oe es 67 tT wee we EN sco" on wes ree Teh rare "G 


GTTATTGGCATCATTAACAACACAGTTTATGATCCTCTGCAACCTGAGCTTGACTCATTC 
STEIN LAE AT OTE IE OTR SETE LET CAE GST OTE AE SEE SEE TERT EN TESLA TE TEAL CIN TEE ee 18 CTE 


AAAGAAGAGCTGGACAAGTACTTCAAAAATCATACATCACCAGATGTTGATCTTGGCGAC 
HEI G POTTED CECH CHIC CH HCH OUGHT Ginnie 


ATTTCAGGCATTAACGCTTCTGTCGTCAACATT CAAAAAGAAATTGACCGCCTCAATGAG 
FOC AGC SEE AN FEET EGO ICE AE CAE ELS EES ICH CEE TO AT CEC TED 


GTCGCTAAAAATTTAABATGAATCACTCATTGACCTTCAAGAATTGGGAAAATATGAGCAA 
wagricragwucergu HCUNCRCOU UGH he tes ages Ge nocuinncey A rr canetning 


TATATTAAATGGCCTTGGTATGTTTGGCTCGGCTTCATTGCTGGACTAATTGCCATCGTC 
WO CRUE COE ETC Ce TETRIS COT CTT COTTE IEA TTT CERT Ca IEC IE CoE aH FETE TES 


ATGGTTACAATCTTGCTTTGTTGCATGACTAGTTGTTGCAGTTGCCTCAAGGGTGCATGC 
we nee st "Cc" w Woe ere weorec Utena eae CIEE "Eu epee AiG eis " "gt wae iG ro" ore 


TCTTGTGGTTCTTGCTGCAAGTTTGATGAGGATGACTCTGAGCCAGTTCTCAAGGGTGTC 
BEC AD GE 1 FONE EE TENET ESCH COE RE TEE NONE ATCT IP AT CSCO TU ET AE SEAT CORE TE AN ty Me THAT HME U8 "G 


AAATTACATTACACATAAACGAACTTATGGATTTGTTTATGAGATTTTTTACTCTTGGAT 
ity "GCc"G" "eu tine "orgy ee "CGA" 


CAATTACTGCACAGCCAGTAAAAATTGACAATGCTTCTCCTGCAAGT 


FIGURE 32.3 
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